张翔

Loading...

数据挖掘

从理论开始,在广告定向初步尝试,挖掘浏览队列

Subitems 理论学习,清华出版社的《数据挖掘教程》
数据抽样模块,涉及到系统结构,通道的瓶颈
R基本熟悉,完成kmeans聚类,聚出一大堆作弊
聚类的结果,进行解释

Comment: (1 replies total)


09/14/2007 张翔
在数据收集时,适当的分开储存,比如分10个文件夹。
当抽样的时候,不用读取所有数据,抽取其中一个文件夹就行了

To post your comment, Please login first.