DISCUSSION 4

Recording
Slides
Type
Discussion
正则表达式 和 数据可视化的讨论。
正则表达式中,学到了从字符串中匹配多个子串,例如给定如下字符串:
169.237.46.168 - - [26/Jan/2014:10:47:58 -0800] "GET /stat141/Winter04/ HTTP/1.1" 200 2585 "http://anson.ucdavis.edu/courses/"
从中提取 日期,使的day is 26, month is Jan, and year is 2014.
import re pattern = r"\[(\d+)\/(.*)\/(\d{4})\:" matches = re.findall(pattern, log) day, month, year = matches[0]
其中,pattern中一个括号表示匹配的一个字串
 
数据可视化中,讨论了几张示例图中的不合理的地方。