米兰官方网页版-米兰MiLan(中国)







  • 咨询热(rè)线:021-80392549

    米兰官方网页版-米兰MiLan(中国) QQ在线 米兰官方网页版-米兰MiLan(中国) 企业微信(xìn)
    米兰官方网页版-米兰MiLan(中国)
    米兰官方网页版-米兰MiLan(中国) 资讯 > AI挖掘技(jì)术(shù) > 正(zhèng)文

    常见的(de)机(jī)器学习算法

    2020/06/01天极网3636

    常见的机(jī)器学习算(suàn)法

    诞生于1956年的人工智能,由于受到智(zhì)能算法、计算速(sù)度、存储水平等因素的影响,在六十多年的发展(zhǎn)过程中经历了多次(cì)高潮(cháo)和低谷(gǔ)。最近几年,得益于数据量的上涨、运算力的(de)提(tí)升,特别是机器学习新算法的出现,人工(gōng)智能迎来了大爆发的(de)时代(dài)。

    常见的机器学习(xí)算法

    提到(dào)机器学习这个词时,有(yǒu)些人首先(xiān)想到(dào)的可能是科幻电影里的(de)机器人。事(shì)实上,机器学(xué)习是一门(mén)多领域(yù)交叉(chā)学(xué)科,涉及概率论、统计学、算法(fǎ)复杂(zá)度理论等多(duō)门学科(kē)。专门研究计算(suàn)机(jī)如何模拟或实现(xiàn)人类的学习行为,利用数据或(huò)以往的经验,以此优化计算机程(chéng)序的性能标准。

    根(gēn)据(jù)学习任(rèn)务的不同,我们可以将机器学习分(fèn)为监督学(xué)习、非监督学习、强(qiáng)化学习三种类(lèi)型,而每种类型又(yòu)对应着(zhe)一些算法。

    各种算法(fǎ)以及对应的任务类型

    接下来就(jiù)简单介(jiè)绍几种常(cháng)用(yòng)的机器学习算法及其(qí)应(yīng)用场景,通过本篇文章大家可以对机器学习的常用算法有个常(cháng)识性(xìng)的认(rèn)识。

    一(yī)、监督(dū)学习

    (1)支(zhī)持向(xiàng)量机(Support Vector Machine,SVM):是一类按监督学习方(fāng)式对数据进行(háng)二元分(fèn)类(lèi)的广义线性分类器,其决策边(biān)界是对学习(xí)样本求解的最大边(biān)距超平面(miàn)。例如,在(zài)纸上有两类线性可分的点,支持向量机会寻(xún)找一条(tiáo)直线将这两(liǎng)类点(diǎn)区分开来,并且与这些点的距离都尽(jìn)可能远(yuǎn)。

    常见的机器(qì)学习算法

    优点:泛化错误(wù)率低(dī),结(jié)果易解释。

    缺点:对大规模训(xùn)练样(yàng)本难以实施,解(jiě)决多(duō)分类问题存在困难,对参数调节和核(hé)函数(shù)的选(xuǎn)择(zé)敏感。

    应(yīng)用场景(jǐng):文本分类、人(rén)像识别、医学诊断等。

    (2)决策树(Decision Tree):是一个(gè)预测模型,代(dài)表的(de)是(shì)对象属性与对象值之间的一(yī)种(zhǒng)映射关系。下图是(shì)如何(hé)在决策树中建模的简(jiǎn)单示例:

    常见的(de)机器(qì)学习(xí)算法

    优点:易于(yú)理(lǐ)解和解(jiě)释(shì),可以(yǐ)可视化分析,容易提取出规(guī)则;能(néng)够处(chù)理不相关的特征。

    缺点:对缺失(shī)数(shù)据处(chù)理比较困难。

    应用场景:在决(jué)策过程应(yīng)用较多(duō)。

    (3)朴素贝叶斯分类(Naive Bayesian classification):对(duì)于给出的待分类项,求解此项出现(xiàn)的(de)条件下各个类别(bié)出(chū)现的概(gài)率,哪个最大,就认为此待分(fèn)类属(shǔ)于哪个类别(bié)。贝(bèi)叶斯公式为(wéi):p(A|B)= p(B|A)*p(A/p(B),其中P(A|B)表示后验概率,P(B|A)是似然值,P(A)是类别的先验概率,P(B)代表预(yù)测器的(de)先验概率(lǜ)。

    优(yōu)点:在数据较少(shǎo)的(de)情况(kuàng)下仍然有效(xiào),可以处理多类别问题。

    缺点(diǎn):对输入数据的准备方式较(jiào)为敏感。

    应用场景:文本分(fèn)类、人脸识(shí)别(bié)、欺诈检测(cè)。

    (4)k-近邻算法(fǎ)(K-Nearest Neighbor,KNN):是一种基于实例的学(xué)习(xí),采用(yòng)测量不同(tóng)特征(zhēng)值之间的(de)距离方法进行分类。其基(jī)本思路(lù)是:给(gěi)定一个训练(liàn)样本集,然后输入没有标签的新(xīn)数据,将新数据的(de)每个特征(zhēng)与样本集中数据对(duì)应的(de)特征(zhēng)进(jìn)行比(bǐ)较,找到最(zuì)邻近的k个(通常是(shì)不大于20的整(zhěng)数)实例,这k个实(shí)例的多数属于某个类,就把该输入实例分类(lèi)到这(zhè)个类中。

    优点:简单(dān)、易于(yú)理解、易于(yú)实现,无需(xū)估计参数(shù)。此外,与(yǔ)朴(pǔ)素贝叶斯(sī)之类的算法比,无数据输入假定、准确度高、对异(yì)常数据(jù)值不(bú)敏感。

    缺点:对于训练数据(jù)依赖程(chéng)度比(bǐ)较大,并(bìng)且(qiě)缺少训练阶段,无法应对多样本。

    应用场(chǎng)景:字符识别(bié)、文本(běn)分类、图像识(shí)别(bié)等领域(yù)。

    二、非监督学习(xí)

    (1)主成分分析(Principal Component Analysis,PCA):是一种统计方法。其主要思(sī)想是将(jiāng)n维特征映射到k维(wéi)上,这k维是全新的正交(jiāo)特征也被称为(wéi)主(zhǔ)成分,是在原有n维特征的基础上重新(xīn)构造出(chū)来(lái)的k维特征。

    常(cháng)见(jiàn)的(de)机器学习算(suàn)法

    优点:降低数(shù)据的复杂性,识别最重要的多个特征。

    缺点:主(zhǔ)成分(fèn)各个特征维度(dù)的含义具有一定(dìng)的(de)模糊性,不(bú)如原始样本特(tè)征的(de)解释性(xìng)强(qiáng);有可(kě)能损(sǔn)失有用的信息。

    应用场(chǎng)景(jǐng):语音、图像(xiàng)、通(tōng)信的分析(xī)处理。

    (2)奇异值分解(jiě)(Singular Value Decomposition,SVD):可以将一个比较复杂的(de)矩阵用更小更简单(dān)的(de)几个子矩阵的(de)相乘来表示,这些小(xiǎo)矩阵描述的(de)是矩阵的重要的特(tè)性。

    优点(diǎn):简(jiǎn)化(huà)数据,去除噪声点(diǎn),提高算法的结果(guǒ)。

    缺点(diǎn):数据的转换可能难以理解(jiě)。

    应用场(chǎng)景:推荐(jiàn)系统、图片压(yā)缩等。

    (3)K-均值聚类(K-Means):是一种迭代求(qiú)解的聚(jù)类分析算法,采用距离作为相(xiàng)似(sì)性指标(biāo)。其工作(zuò)流程是随机确定(dìng)K个对象作为初始的聚类(lèi)中心,然后计算每个对象与各个种子聚类中心之(zhī)间的(de)距离,把每个对象(xiàng)分配给距离它最(zuì)近的聚类中心。

    常见的机器学习算(suàn)法(fǎ)

    优(yōu)点:算法简单(dān)容易实(shí)现。

    缺点:可能收敛到局部最小值(zhí),在(zài)大规模数据集上收敛(liǎn)较(jiào)慢。

    应用场景(jǐng):图像(xiàng)处理、数据分析以及市场研究等(děng)。

    三、强化学习

    Q-learning:是一个基(jī)于值(zhí)的(de)强化学(xué)习(xí)算法,它根据动作(zuò)值函数评(píng)估应该选(xuǎn)择哪(nǎ)个动(dòng)作,这个函(hán)数决定了处于某一个(gè)特定(dìng)状态以及在(zài)该(gāi)状态下采取特定动作的奖(jiǎng)励期望值。

    优(yōu)点:可以(yǐ)接收(shōu)更广的数(shù)据范围。

    缺(quē)点:缺乏通用性。

    应用场景:游戏(xì)开发。

    以上(shàng)就(jiù)是文章的(de)全部(bù)内容,相信大家对常用的机器(qì)学习(xí)算(suàn)法应该有了大致的了(le)解。

    现如今,我们越(yuè)来越多(duō)地(dì)看到机(jī)器学习(xí)算法为人类带来(lái)的实际价值,如它们提供(gòng)了(le)关键(jiàn)的洞察(chá)力和信息(xī)来(lái)报(bào)告战略决策(cè)。可以肯定的是(shì),随着机(jī)器学(xué)习越来越流行,未(wèi)来还将出现越来越多能很好地(dì)处理任务的算法(fǎ)。

    关键词: AI挖掘技术




    AI人工智(zhì)能(néng)网(wǎng)声(shēng)明(míng):

    凡资(zī)讯来源(yuán)注明(míng)为(wéi)其他媒体来(lái)源的信息(xī),均为转载自(zì)其他媒体,并不代(dài)表本网站(zhàn)赞同其观(guān)点,也不代(dài)表本网站(zhàn)对其真(zhēn)实性负责。您(nín)若对该文章内(nèi)容有任何疑问(wèn)或(huò)质疑,请立(lì)即(jí)与网站(www.fartooclub.huaibei.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系(xì),本网站将迅速给(gěi)您回应并做处理。


    联系电话:021-31666777   新闻、技术文章投稿QQ:3267146135   投(tóu)稿邮箱:syy@gongboshi.com

    工博士人工智能网
    米兰官方网页版-米兰MiLan(中国)
    扫描(miáo)二维码关注微信
    扫(sǎo)码反馈

    扫一扫,反馈当前(qián)页面

    咨(zī)询反馈
    扫码关注

    微信公众号(hào)

    返回顶部

    米兰官方网页版-米兰MiLan(中国)

    米兰官方网页版-米兰MiLan(中国)