leyu乐鱼


    1. 咨询热线:021-80392549

      leyu乐鱼 QQ在线(xiàn) leyu乐鱼 企业微信
      leyu乐鱼
      leyu乐鱼 资讯 > AI挖(wā)掘技术(shù) > 正文

      常见(jiàn)的机器学习(xí)算法

      2020/06/01天极网3635

      常(cháng)见的机器学习(xí)算法

      诞生于1956年的(de)人工智(zhì)能,由于受到(dào)智(zhì)能算法、计算速度(dù)、存储水(shuǐ)平等因素的影响,在(zài)六十多年的(de)发展过程中(zhōng)经历了多(duō)次高潮和低谷。最近几年,得益于(yú)数据量的上涨、运算力(lì)的提升,特别是(shì)机器学习新算法(fǎ)的出现,人工智能(néng)迎来了大(dà)爆发的时代。

      常见的机器学习算法

      提到机器学习这个词时,有些(xiē)人首先想到的可能是科幻(huàn)电影里的机器人。事实上,机(jī)器(qì)学习是一门多领域交叉学科(kē),涉(shè)及概率论、统计学、算法复杂度(dù)理(lǐ)论等多门学(xué)科。专门研究计算机如(rú)何(hé)模拟或实(shí)现人类的学(xué)习(xí)行为,利用数据或以往的经验,以此(cǐ)优化(huà)计算机程序的性能标准。

      根据(jù)学习任务的不同(tóng),我们可以将机器学习分为监督学习、非监督学习、强化学习三种(zhǒng)类型,而(ér)每种类型又对应着一些算法(fǎ)。

      各种算法以及对应的任务类型

      接下来就简单介绍几种常用的机器学习算法及其应用场景,通过本篇文章大家可(kě)以对机器学(xué)习(xí)的常用算法有个常识性的(de)认识。

      一、监督学习

      (1)支持向量机(Support Vector Machine,SVM):是(shì)一类按监督(dū)学习(xí)方式对(duì)数(shù)据进(jìn)行二元分类的广(guǎng)义(yì)线性分(fèn)类器,其决策边(biān)界(jiè)是对学习样本求解(jiě)的最(zuì)大边距超平面(miàn)。例如,在纸上有两类线性可分的(de)点,支持向量机(jī)会寻找一条(tiáo)直(zhí)线将这两类点(diǎn)区(qū)分开来,并且与这些点的距离都尽可(kě)能远(yuǎn)。

      常见(jiàn)的机器学(xué)习算法

      优(yōu)点:泛化错(cuò)误率低,结果易解释。

      缺(quē)点:对大规(guī)模训练样本难以实施,解决多分类问题存在(zài)困难(nán),对参数调节和核函(hán)数的选(xuǎn)择(zé)敏感。

      应用场景(jǐng):文本分类(lèi)、人像(xiàng)识别、医(yī)学诊断等。

      (2)决策(cè)树(Decision Tree):是(shì)一个预测(cè)模型,代表的(de)是对象属性与对(duì)象(xiàng)值之间的一种映射关系。下图是如何在决策树(shù)中(zhōng)建(jiàn)模的简单示例(lì):

      常见(jiàn)的(de)机器学习算法

      优点:易于理解和解释,可以可视化分析,容(róng)易(yì)提取(qǔ)出(chū)规(guī)则;能够处理不相关的特征。

      缺点:对(duì)缺失数据处理比较困难。

      应用场景:在决策过(guò)程应用(yòng)较多。

      (3)朴素贝叶斯分类(lèi)(Naive Bayesian classification):对于(yú)给出的待分类项,求解此项出(chū)现的(de)条件下各个(gè)类别出现的(de)概率,哪个最(zuì)大,就(jiù)认为(wéi)此待分类属于哪个(gè)类别。贝叶斯公式为:p(A|B)= p(B|A)*p(A/p(B),其中P(A|B)表(biǎo)示(shì)后验概率(lǜ),P(B|A)是(shì)似然值,P(A)是类别的(de)先验概(gài)率,P(B)代表预测器(qì)的(de)先验概率。

      优点:在数据(jù)较少的情况下仍(réng)然有效,可以(yǐ)处理多类别问(wèn)题。

      缺点:对输入数据的准备方式较为敏(mǐn)感。

      应用场景(jǐng):文本分(fèn)类、人脸识别(bié)、欺诈检测(cè)。

      (4)k-近(jìn)邻算法(K-Nearest Neighbor,KNN):是一种基(jī)于实例的(de)学(xué)习(xí),采用测量不同(tóng)特(tè)征值之间的距离(lí)方(fāng)法进行分(fèn)类。其基本思路是(shì):给定一个训练样本(běn)集,然(rán)后(hòu)输入没有(yǒu)标签的新数据(jù),将新数据(jù)的每个特征与样本集中数据对(duì)应(yīng)的特(tè)征进行(háng)比(bǐ)较,找到最邻近(jìn)的(de)k个(通常是不大于20的整数)实例,这k个实例的多数属于某(mǒu)个类,就把该输(shū)入实例分类到这个类中(zhōng)。

      优点:简(jiǎn)单、易于理解、易(yì)于实现,无需估计参数(shù)。此外,与朴素贝叶斯之类的算法(fǎ)比,无数据输入(rù)假定、准确度高、对异常数据值不敏(mǐn)感。

      缺点:对于训练数据依(yī)赖程度比较大,并且缺少训练阶段,无法应对多样本(běn)。

      应用场景(jǐng):字符(fú)识别、文本分类(lèi)、图像识别等领(lǐng)域。

      二、非监督(dū)学(xué)习

      (1)主成分分析(Principal Component Analysis,PCA):是一种统计方法(fǎ)。其(qí)主(zhǔ)要思想是将n维(wéi)特征映射到k维上,这k维(wéi)是全(quán)新的正交特征也被称为主(zhǔ)成分,是在原有n维(wéi)特(tè)征的(de)基础上重新构造出来的(de)k维特征。

      常见的机器学习算法

      优点:降低(dī)数据(jù)的复杂性(xìng),识别最重(chóng)要的多个特征。

      缺点:主成分各个(gè)特征维度的含义(yì)具有一定的模糊性,不如原始(shǐ)样本特征的解释性强;有可能损失有用的信息。

      应(yīng)用场(chǎng)景:语(yǔ)音、图像、通信(xìn)的分析处理(lǐ)。

      (2)奇异值(zhí)分(fèn)解(Singular Value Decomposition,SVD):可(kě)以(yǐ)将一个比较复杂(zá)的矩阵用更小更简(jiǎn)单的(de)几个子矩(jǔ)阵的相乘来表示,这些小矩阵描述的是矩阵的(de)重要的(de)特性。

      优点:简化数(shù)据(jù),去除噪(zào)声点,提高算法的结果。

      缺点:数据的转换可能(néng)难以理解。

      应(yīng)用场(chǎng)景:推荐(jiàn)系统、图片压缩等。

      (3)K-均(jun1)值聚类(K-Means):是一种迭代求解的聚类分析算法,采用距离作(zuò)为相似性指标。其工作流(liú)程是(shì)随机确定K个对象(xiàng)作为初始(shǐ)的(de)聚类中心,然后计(jì)算每个对象与各个种子聚类(lèi)中心之间的距离,把每个对象分配给距离它最近的聚类(lèi)中(zhōng)心。

      常见的机器学(xué)习算(suàn)法

      优点:算(suàn)法简单容易实现。

      缺点(diǎn):可(kě)能收敛(liǎn)到局(jú)部最小值,在大规模数据集上收敛较(jiào)慢(màn)。

      应用场景:图像(xiàng)处理、数(shù)据分析以及市(shì)场研(yán)究等。

      三、强化学习

      Q-learning:是一个基于值的强化学习算法,它根据(jù)动作值函数评估应该选择哪个动作(zuò),这个函数(shù)决(jué)定(dìng)了处于某一个特定(dìng)状态以(yǐ)及在该(gāi)状态下采取(qǔ)特定动作的奖励期望值。

      优点(diǎn):可以(yǐ)接收更(gèng)广的数据范围。

      缺(quē)点(diǎn):缺乏通用性。

      应用场景:游(yóu)戏开发。

      以(yǐ)上就是文章(zhāng)的全部内容,相信大(dà)家对常用的机器学习算法应该有了大(dà)致的了解(jiě)。

      现如今,我们(men)越来越(yuè)多地看到机器学习算(suàn)法为人(rén)类带来的(de)实(shí)际价(jià)值,如它们(men)提(tí)供了关键(jiàn)的洞察力(lì)和(hé)信息来报告战略决(jué)策。可以肯定的(de)是,随着机(jī)器(qì)学习越来越流(liú)行,未(wèi)来还将(jiāng)出现越来越多能很好地处(chù)理任务的算法。

      关键词: AI挖掘技术(shù)




      AI人工智能网(wǎng)声明:

      凡(fán)资(zī)讯来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代(dài)表本网(wǎng)站对其真实性负责。您若对该(gāi)文章内容有任何疑问或质疑,请立即与(yǔ)网站(www.ankang.huangnan.sys.jixi.ww38.viennacitytours.com)联系,本网站将迅速给您(nín)回应并做处理。


      联系电话:021-31666777   新闻(wén)、技术文章(zhāng)投稿(gǎo)QQ:3267146135   投稿邮箱:syy@gongboshi.com

      工博士(shì)人工(gōng)智能网
      leyu乐鱼
      扫描二维码关注微(wēi)信
      扫码反馈

      扫一扫,反馈(kuì)当(dāng)前页面

      咨询反馈(kuì)
      扫码关注

      微(wēi)信公众号

      返回顶(dǐng)部

      leyu乐鱼

      leyu乐鱼