塞班岛娱乐-业界公认的最权威网站,欢迎光临!

塞班岛娱乐_塞班岛娱乐平台_塞班岛娱乐官网

机器学习算法?机器学习中的主动学习算法 有什么

时间:2018-04-21 06:11来源:张琪 作者:荒吴的四烨草 点击:
自动研习的算法首要有两种 (1)基于评委的本领 (committee-centred methods) 首先用各种不同的研习器对样本举办标注,然后由标注人员对有争议的标注结 果作出最终果断。相比看机器学习算法
自动研习的算法首要有两种
(1)基于评委的本领 (committee-centred methods)
首先用各种不同的研习器对样本举办标注,然后由标注人员对有争议的标注结
果作出最终果断。相比看机器学习算法。不同的研习器之间的分歧是由它们对样本标注成果预测的区别所
变成的。学习。
(2)基于相信度的本领
(certone particularinty-centred methods)
先由模型给出具有较低相信度的样本,再交给标注人员选拔性地举办标注。学习。置
信度的计算常常是由研习器度量
n-最优(n-perfect)标注成果之间的区别取得的。机器。
上面周到描画一下基于评委的本领和基于相信度的本领的普遍流程。
基于评委的本领:对比一下机器学习算法。
(1) 对付由 n
个未标注样本组成的样本组 B 中的每个样本
e,你看算法。利用从先前标注样本中教练进去的 k 个模型对其举办标注,学会机器学习算法。取得 k
个成果{L1:L2...Lk},机器学习算法。经过{L1:L2...Lk},机器。对每个 e
丈量出具有争议的标注成果De ;
(2) 从样本组 B 当选拔出 m
个具有最高 De
值的样本交给标注人员举办标注。算法。把酬劳标注好的样本加进教练样本库里;
(3)
在增添后的教练样本库的基本上,机器学习中的主动学习算法。再重新取得 k
个模型。想知道机器学习算法。首先将语料库区分为相接的n个样本组,贯串整个语料库,机器学习算法。反复地在
n 个样本组中次序地举办该历程。听听机器学习算法。要是语料库不大,主动。样本 n
正好等于语料库的大小,学习。那么这个历程中的每一步都是在语料库的未标注样本当选拔出
m 个全局最优的实例,听听机器学习算法。要是语料库的大小比样本 n
大,那么这个历程是衔接举办的。什么。
基于相信度的本领:
(1)从先前标注的样本中教练出一个模型;
(2)对付 N
个未标注的样本组中的每一个样本用模型对其举办标注,机器学习算法。评价模型标
注的相信度;
(3)从样本组当选拔 m
个具有最低相信度的样本交给标注人员举办标注;
(4)把新标注的样本加进教练语料中;
(5)反复实行以上历程直到标注人员结束或未标注样本用尽。
Hwone particular
运用基于相信度的本领从 Penn Treemortggrowing older lender
语料库研习语法,有什么?。把研习器对一个样本的标注成果的不决定性同等于该样本的“教练功用值”。机器学习算法。要是研习器可以从大宗的未标注语料中辨别出具有较高教练功用值的
样本的子集,对于有什么?。标注人员就不须要消费年华去标注那些不富含音信的样本。你知道机器学习中的主动学习算法。基于相信度的本领的难点在于如何布局一种度量本领来评价研习器标注成果的相信度。
你说的自动研习算法是什么意见意义? 是指无监视研习吗?
(责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
最新评论 进入详细评论页>>
推荐内容