借阅:0 收藏:0

:实用案例解析 /Drew Conway,Jobn Myles Wbite著 go陈开江,刘逸哲,孟晓楠译

ISBN/ISSN::978-7-111-41731-6

出版:北京 :机械工业出版社 ,2013.04

载体形态:288页 :图,图版( go24CM

丛编:O'reilly精品图书系列

简介:本书全面系统地介绍了机器学习的方法和技术,全书案例既有分类问题、也有回归问题;既包含监督学习,也涵盖无监督学习。本书讨论的案例涉及分类、回归、聚类、降维、最优化问题等。

中图分类号:TP181

责任者:Drew Conway,Jobn Myles Wbite著 著

    • 评分:
    • 加入暂存架

    豆瓣内容简介:

    机器学习是计算机科学和人工智能中非常重要的一个研究领域,近年来,机器学习不但在计算机科学的众多领域中大显身手,而且成为一些交叉学科的重要支撑技术。本书比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还讨论了一些有生命力的新理论、新方法。
    全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。本书讨论的案例从分类讲到回归,然后讨论了聚类、降维、最优化问题等。这些案例包括分类:垃圾邮件识别,排序:智能收件箱,回归模型:预测网页访问量,正则化:文本回归,最优化:密码破解,无监督学习:构建股票市场指数,空间相似度:用投票记录对美国参议员聚类,推荐系统:给用户推荐R语言包,社交网络分析:在Twitter上感兴趣的人,模型比较:给你的问题找到最佳算法。各章对原理的叙述力求概念清晰、表达准确,突出理论联系实际,富有启发性,易于理解。在探索这些案例的过程中用到的基本工具就是R统计编程语言。R语言非常适合用于机器学习的案例研究,因为它是一种用于数据分析的高水平、功能性脚本语言。
    本书主要内容如下:
     开发一个朴素贝叶斯分类器,仅仅根据邮件的文本信息来判断这封邮件是否是垃圾邮件;
     使用线性回归来预测互联网排名前1000网站的PV;
     利用文本回归理解图书中词与词之间的关系;
     通过尝试破译一个简单的密码来学习优化技术;
     利用无监督学习构建股票市场指数,用于衡量整体市场行情的好坏;
     根据美国参议院的投票情况,从统计学的角度对美国参议员聚类;
     通过K近邻算法构建向用户推荐R语言包;
     利用Twitter数据来构建一个“你可能感兴趣的人”的推荐系统;
     模型比较:给你的问题找到最佳算法。

    豆瓣作者简介:

    Drew Conway,机器学习专家,拥有丰富的数据分析与处理工作经验。目前主要利用数学、统计学和计算机技术研究国际关系、冲突和恐怖主义等。曾作为研究员在美国情报和国防部门供职数年。拥有纽约大学政治系博士学位,曾为多种杂志撰写文章,是机器学习领域的著名学者。
    John Myles White,机器学习专家,拥有丰富的数据分析与处理工作经验。目前主要从理论和实验的角度来研究人类如何做出决定,同时还是几个流行的 R 语言程序包的主要维护者,包括 ProjectTemplate 和 log4r。拥有普林斯顿大学哲学系博士学位,曾为多家技术杂志撰稿,发表过许多关于机器学习的论文,并在众多国际会议上发表演讲。

    目录:

    前言 1
    第1章 使用R语言 9
    R与机器学习 10
    第2章 数据分析 36
    分析与验证 36
    什么是数据 37
    推断数据的类型 40
    推断数据的含义 42
    数值摘要表 43
    均值、中位数、众数 44
    分位数 46
    标准差和方差 47
    可视化分析数据 49
    列相关的可视化 68
    第3章 分类:垃圾过滤 77
    非此即彼:二分类 77
    漫谈条件概率 81
    试写第一个贝叶斯垃圾分类器 82
    第4章 排序:智能收件箱 97
    次序未知时该如何排序 97
    按优先级给邮件排序 98
    实现一个智能收件箱 102
    第5章 回归模型:预测网页访问量 128
    回归模型简介 128
    预测网页流量 142
    定义相关性 152
    第6章 正则化:文本回归 155
    数据列之间的非线性关系:超越直线 155
    避免过拟合的方法 164
    文本回归 174
    第7章 优化:密码破译 182
    优化简介 182
    岭回归 188
    密码破译优化问题 193
    第8章 PCA:构建股票市场指数 203
    无监督学习 203
    主成分分析 204
    第9章 MDS:可视化地研究参议员相似性 212
    基于相似性聚类 212
    如何对美国参议员做聚类 219
    第10章 kNN:推荐系统 229
    k近邻算法 229
    R语言程序包安装数据 235
    第11章 分析社交图谱 239
    社交网络分析 239
    用黑客的方法研究Twitter的社交关系图数据 244
    分析Twitter社交网络 252
    第12章 模型比较 270
    SVM:支持向量机 270
    算法比较 280
    参考文献 287

    分馆名 馆藏部门 图书条码 索书号 登录号 状态 馆员代借
    序号 图书条码 索书号 登录号 藏书部门 流通状态 年卷期 装订册 装订方式 装订颜色
      类型 说明 URL
      评 论
      评分:
      发表

      北京创讯未来软件技术有限公司 版权所有 ALL RIGHTS RESERVED 京ICP备 09032139

      欢迎第117631位用户访问本系统