LZN's Blog CodePlayer

【Coursera】Data Scientist's Toolbox


MaterialW1-L1core: how to use data to solve questionsdata deluge 数据泛滥 Big data统计学是毕业生职场的敲门砖We are lucky: explosive data growing利用数据设计算法、分析预报获得结论的比赛 projectWhy R 1. various packages 2. free 3. Stack Overflow mining the web 处理技巧-数学和统计知识-专业知识 QQ图片20150713150848 W1-L2 利用R的IDE RStudio R script xxx.R # 注释符号 Rmd R markdown document portfolio github仓库 W1-L3 use message board Often the fastest answer is the one you find yourself R帮助 ?function_name help.search("rnorm") args("rnorm") --> fuction (n, mean = 0, sd =1) NULL 直接输入函数名称,可以得到函数的解释 提问的艺术: Provide the minimum information good question: R 2.15.0 lm() function on Mac OS X 10.6.3 seg fault W1-L4 数据的分散性决定了Hacking Skills的重要性 Cross Validated 永远学习,永远勇于接受新事物! 采用Stack overflow搜索关于R的内容时,要采用标签 如[r],仅用r作为关键词会搜索到很多无用的东西 用google的时候: "[data type] data analysis" "[data type] R package" (better) W1-L5 subsetting data 抽取数据 readlines function lapply 很有趣的函数,对一个列表中的所有元素采用某一个函数去执行 W1-L6 clustering 聚类分析 W1-L7 数据科学家最基本的素质:reproducible research 需要用到LaTex W1-L8 likelihoods 似然估计 common distribution 常用概率分布 confidence interval 置信区间 hypothesis test 假设检验 bootstrapping 自助法 * 自抽样? power 统计功效 W1-L9 回归分析的调整分析 adjusting analysis W1-L10 boosting bagging W1-L11 Shiny 交互式R共享 W1-L12 Windows下安装R www.Rseek.org W2-L2 Command Line Interface: command flags arguments cp -r ./ ../test W2-L3 Introduction to Git $git config --list $git config --global user.name "" $git config --global user.email ""   W2-L7 markdown readme.md ##hello   (## means secondary heading) * hello * world (unordered list) W2-L8 R packages install.packages("slidify") library("xxx")    #load the function W3-L4 http://figshare.com   Point