机器学习-k-近邻算法通俗表述及应用案例解析

开篇场景

众所周知,电影可以按照题材进行分类,然而题材本身如何定义、谁来判定某部电影属于哪个题材?换个角度就是:同一题材的电影具有哪些公共特征呢?动作片具有哪些共有特征,使得动作片之间非常类似,而与爱情片存在哪些明显的差异呢?动作片中也会有接吻的镜头,爱情片中也会有打斗的镜头,我们不能单纯依靠是否存在打斗或接吻来判断影片的类型。但爱情片中接吻镜头更多,动作片中打斗场景更频繁,我们可以基于此类场景在某部电影中出现的次数判断电影的分类。k-近邻算法为此提供了模型基础。 read more...

机器学习-学习导引

导读

作为一名coder,我们要做的大部分事情是根据用户需求生产出满足其要求的功能来,比如一个在线购物网站,需要的是发布商品并供他人浏览购买,为此我们需要开发一个web表单,允许用户输入所售产品的信息,然后将这些信息存储在一个区域,然后再将这些信息可以通过适当地方式展示出来。没错这样的方式可以赚钱,但如果要让应用更好,则需要一些更加智能的因素,比如:自动过滤虚假信息、检测不正当交易、给出用户可能喜欢的商品等等,为了实现这个目标我们需要应用机器学习方法,当然终端用户并不关心幕后的这些“魔法”,应用能够有效地运行就足够了,这就是好产品的标志。 read more...