机器学习:K近邻算法

本文内容介绍机器学习的K近邻算法,用它处理分类问题。分类问题的目标是利用采集到的已经经过分类处理的数据来预测新数据属于何种类别。 K近邻算法 K近邻算法对给定的某个新数据,让它与采集到的样本数据点分别进行比较,从中选择最相似的K个点,然后统计这K个点中出现的各个类别的频数,并判定 »

机器学习:了解线性回归的原理

上一篇文章介绍如何使用sklearn进行线性回归预测。接下来本文将深入原理,了解线性回归是如何工作的。 基础概念 线性回归为何叫线性?实际上,像在处理Google的股票统计数据时,我们使用线性回归是在这堆数据所在的N维空间中找到一条线来描述这些数据的规律,因此才叫线性回归。这个过 »

机器学习:使用scikit-learn的线性回归预测Google股票

这是机器学习系列的第一篇文章。 本文将使用Python及scikit-learn的线性回归预测Google的股票走势。请千万别期望这个示例能够让你成为股票高手。下面按逐步介绍如何进行实践。 准备数据 本文使用的数据来自www.quandl.com网站。使用Python相应的qua »

机器学习:如何通过Python入门机器学习

我们都知道机器学习是一门综合性极强的研究课题,对数学知识要求很高。因此,对于非学术研究专业的程序员,如果希望能入门机器学习,最好的方向还是从实践触发。 我了解到Python的生态对入门机器学习很有帮助。因此希望以此作为突破口入门机器学习。 我将会记录一个系列的学习与实践记录。记录 »

Pandas快速入门笔记

我正以Python作为突破口,入门机器学习相关知识。出于机器学习实践过程中的需要,我快速了解了一下提供了类似关系型或标签型数据结构的Pandas的使用方法。下面记录相关学习笔记。 数据结构 Pandas最主要的知识点是两个数据结构,分别是Series和DataFrame。你可以分 »