玩手机游戏,享快乐生活!
应用
超级视力表1.1.7官方下载_最新超级视力表app免费下载 体教联盟4.8.5官方下载_最新体教联盟app免费下载 医护之家2.4.9官方下载_最新医护之家app免费下载 BBIN电子1.0官方下载_最新BBIN电子app免费下载 美付宝4.0.0官方下载_最新美付宝app免费下载 心悦俱乐部4.9.5.31官方下载_最新心悦俱乐部app免费下载 慧眼识图1.17官方下载_最新慧眼识图app免费下载 堆糖7.2.5官方下载_最新堆糖app免费下载 青芒果订酒店9.3.3官方下载_最新青芒果订酒店app免费下载 小蚜虫风控1.2.2官方下载_最新小蚜虫风控app免费下载 七彩鲜花4.4.3官方下载_最新七彩鲜花app免费下载 拿货商城1.35官方下载_最新拿货商城app免费下载 红货0.1.2官方下载_最新红货app免费下载 六点喇叭1.0.4官方下载_最新六点喇叭app免费下载 育之有道1.0.2官方下载_最新育之有道app免费下载 和心理咨询4.0.3官方下载_最新和心理咨询app免费下载 麦店1.0.0官方下载_最新麦店app免费下载 A8体育直播-NBA英超4.12.2官方下载_最新A8体育直播-NBA英超app免费下载 热门全本免费小说1.0.6官方下载_最新热门全本免费小说app免费下载 秀健身1.4.0官方下载_最新秀健身app免费下载 今日智投1.0.2官方下载_最新今日智投app免费下载 念念有词2.3.0官方下载_最新念念有词app免费下载 彩云天气5.0.1官方下载_最新彩云天气app免费下载 更多
游戏
放开那三国6.2.9官方下载_最新放开那三国app免费下载 奥特曼联盟之百变超人3.8.0官方下载_最新奥特曼联盟之百变超人app免费下载 叶罗丽公主水晶鞋2.3.0官方下载_最新叶罗丽公主水晶鞋app免费下载 米诺怪兽2:进化4.0.104官方下载_最新米诺怪兽2:进化app免费下载 奥特曼疯狂跑酷1.5.0官方下载_最新奥特曼疯狂跑酷app免费下载 铠甲勇士4之捕将5.6.0官方下载_最新铠甲勇士4之捕将app免费下载 全民捕鱼季1.0官方下载_最新全民捕鱼季app免费下载 废土行动2.10.1官方下载_最新废土行动app免费下载 菲狐倚天情缘1.0.0官方下载_最新菲狐倚天情缘app免费下载 一统天下10.1.8官方下载_最新一统天下app免费下载 神之物语1.0.16官方下载_最新神之物语app免费下载 天仙月1.0.3.3官方下载_最新天仙月app免费下载 天龙八部1.50.2.2官方下载_最新天龙八部app免费下载 口水三国(网游)1.6.0官方下载_最新口水三国(网游)app免费下载 剑与轮回-红包雨2.6.2官方下载_最新剑与轮回-红包雨app免费下载 三国演义:吞噬无界3.8.04官方下载_最新三国演义:吞噬无界app免费下载 真龙霸业1.5.0官方下载_最新真龙霸业app免费下载 三生三世十里桃花1.0.9官方下载_最新三生三世十里桃花app免费下载 游戏王座5.20.40官方下载_最新游戏王座app免费下载 华夏2.1.2官方下载_最新华夏app免费下载 兵人大战2.95.0官方下载_最新兵人大战app免费下载 大天使之剑H52.5.15官方下载_最新大天使之剑H5app免费下载 帝王时代V1.2.45官方下载_最新帝王时代app免费下载 更多
资讯
陈述点评我国城市群营商环境 吁注重城市竞合机制 语音版deepfake呈现:从文本到传神人声,被仿照者高呼真得可怕 优先处理较重患者 北京大医院看急诊能“插队”了 电动车职业怎么改变?选用锂电池或导致成本上升 热销保健品洗脑经:变身“功能性食物” 晋级为“疗法” “五一”假日首日广铁发送旅客243万人次 默克尔:可通过汉堡港事例讨论更好执行“一带一路”建议 “五一”假日首日铁路杭州站发客37.7万人次 加开列车47列 电信“运营不良名单”,为何频现三大运营商 中国移动被查询都是定制机惹的祸?已暂停出售行为 VIP陪练教师请假最少扣一倍课时费 被指压榨薪资 “她需求”走强:我国一二线城市女人购房者快速添加 “脱欧”迷局反致英国经济在短期内反常提速 巴西本年4月通胀率为0.57% 山西动车初次驰出雁门关 朔州名景不再路遥 广交会三期开幕 我国农产品出口量稳质升 “技艺我国”露脸2019伦敦手工艺周 尼泊尔出书人:亚洲文明对话大会是沟通互鉴的优质渠道 美国会民主党人给财长发传票 三要特朗普交税表 对话“立异破壁者”黄渊普:青年人的力气在于立异 不必50万,也能科创板?但这些危险怎样防? 鼓舞个人租借住宅 姑苏5月1日起答应租借房打间隔 新闻分析:韩国三星电子经营赢利缘何锐减 更多
联系我们
版权说明
当前位置: 首页 > 资讯 > 科技

社区问答体系精准匹配信息和人,满意你对获取常识的火急需求

来源:第七纬度下载吧 发布时间:2019-02-19 20:30:28 点击数:
社区问答体系(Community Question Answering, CQA)将信息和人精准匹配,为问题找到适宜的答复者,为答复找到适宜的阅读者,满意了人们对获取常识的火急需求。在CQA中,一个中心问题是为给定的问题引荐具有专业常识并具有答复志愿的专家。假如问题推送战略准确度不高,即不能有用解决问题,也可能给部分不适合答复问题的专家用户带来打扰。

本文以头条问答数据集为例,要点剖析了CQA中专家引荐的常用算法,该数据集总共包含三类信息: 

  1. 专家标签数据:包含一切专家用户的ID,专家爱好标签,处理过的专家描绘;

  2. 问题数据:包含一切的问题的ID,处理过的问题描绘,问题分类,总答复数,精品答复数,总点赞次数;

  3. 问题分发数据:29万条问题推送记载,一条推送记载包含一个问题ID,一个专家用户ID,该专家是否答复了该问题的标示。

下表总结了ByteCup比赛(https://biendata.com/competition/bytecup2016  )中运用的各个特征,其间++表明该特征特别有用,+表明有用,-表明无效。

ByteCup比赛中运用的各算法作用如下:

咱们将比赛中运用的CQA专家引荐算法分为四类:

  1. 依据矩阵分化(Matrix Factorization, MF)的办法,包含SVD, SVD++, Bidirection SVD++, Bidirection ASVD++;

  2. 依据梯度进步树(Gradient Boosting Tree, GBT)的办法,包含GBRT;

  3. 依据深度学习(Deep Learning, DL)的办法,包含AutoRec, CF-NADE, Match-SRNN;

  4. 依据排名(Ranking, R)的办法,包含Rule和Ranking SVM

在CQA专家引荐中,依据MF的办法比其他几类办法取得更好的作用。

本文剖析了比赛中前五名运用的特征,总结如下:

咱们发现,该比赛中前5名都运用了集成学习,单一模型并不能在比赛中取得好的名次。接下来介绍集成学习相关常识。集成学习,就是运用一系列学习器进行学习,并运用某种规则将各个学习器的成果进行整合,然后取得比单个学习器作用更好的学习作用的一种办法。

集成学习能够用于分类问题,回归问题,特征选取,反常点检测等的集成,本文选用分类进行阐明。弱分类器是指分类器仅能对少数样本进行正确分类,其分类作用仅略优于随机猜想。强分类器是指对样本分类的正确率很高的分类器。

经过集成学习进步分类器的全体泛化才能有以下两个条件:

  1. 基分类器之间具有差异性。假如运用的是同一个分类器集成,集成分类器的功能是不会有进步的。

  2. 每个基分类器的分类精度有必要大于0.5。如下图所示,当基分类器精度小于0.5时,跟着集成规划的添加,分类集成分类器的分类精度会下降;可是假如基分类器的精度大于0.5时,集成分类器的终究分类精度是趋近于1的。

集成学习常见的三种办法是Bagging, Boosting和Stacking。

  • Bagging用于进步机器学习算法的安稳性和准确性。

  • Boosting首要用于削减bias(差错)和variance(方差),是将一个弱分类器转化为强分类器的算法。

  • Stacking是一种组合多个模型的办法。

Bagging (Bootstrap Aggregating)对练习集选用有放回采样。经过对原数据集进行有放回的采样,构建出巨细和原数据集T相同的新数据集T1,T2,T3…,然后用这些新的数据集练习多个分类器f1,f2,f3…。终究分类成果依据这些分类器各自成果的投票来决议。Bagging算法中,基分类器之间不存在依靠联系,基分类器能够并行生成。

Bagging的功能依靠于基分类器的安稳性,假如基分类器是不安稳的,Bagging有助于减低练习数据的随机扰动导致的差错,可是假如基分类器是安稳的,即对数据改变不灵敏,那么Bagging办法就得不到功能的进步,甚至会减低。Bagging示例图如下:

Boosting,是一个迭代的进程,每次在新分类器中着重上一个分类器中被过错分类的样本(添加过错分类样本的权重),最终将这些模型组合起来的办法。每次对正确分类的样本降权,对过错分类的样本加权,最终分类器是多个弱分类器的加权组合。

Boosting没有对样本进行重采样,而是对样本的散布进行了调整。Boosting算法中,基分类器之间存在强依靠联系,基分类器需求串行生成。Boosting示例图如下:

Stacking的根本思想是练习一个根本分类器池,然后运用另一个分类器来组合它们的猜测,意图是削减泛化差错。

Stacking的过程如下:

  1. 将练习集分红两个不想交的部分;

  2. 在榜首部分的练习集上练习若干个根本学习器;

  3. 在第二部分的练习集上测验得到的根本学习器;

  4. 运用过程3中的猜测成果作为输入,将正确的呼应作为输出,练习更高等级的学习器。

Stacking示例图如下:

AMiner渠道由清华大学计算机系研制,具有我国彻底自主常识产权。体系2006年上线,招引了全球220个国家/区域800多万独立IP拜访,数据下载量230万次,年度拜访量1000万,成为学术查找和社会网络发掘研讨的重要数据和试验渠道。

https://www.aminer.cn/
专栏二维码

应用 | 游戏 | 资讯 | 联系我们 | 版权说明 |

浙公网安备 33060202000544号
Copyright©第七纬度下载吧 All Rights Reserved.