服务热线:15895595058
产品展示 Categories
联系我们 contact us
联系人:
陆先生
手机:
15895595058
电话:
0512-58628685
地址:
张家港市南丰镇
行业新闻
当前位置:主页 > 新闻动态 > 行业新闻 >
机器学习方法研究-数控滚圆机滚弧机折弯机张家
添加时间:2019-06-18
大气污染导致的雾霾,已经深度影响到了民众的生活,大气治理问题已经受到各方的高度重视。溯本逐源,从源头控制污染物的排放,加上末端的综合治理,才是大气污染防治的治本之策。大气雾霾监测系统利用雾霾检测器和GPRS模块数据传送,将所在地雾霾情况实时监测传输给手机APP终端,手机接收之后将数据整合显示给使用者,达到雾霾监测和提前应对恶劣天气的作用。本文重点是对网络用户中的网络舆情倾向性进行分析,构建一种准确率更高的模型来实现情感倾向判断。网络舆情倾向性分析主要是通过机器学习的方法和制定部分规则的方法,从而能够更加准确地判断出句子的情感倾向性,进而能在实际生活中进行有针对性地积极引导调控。基于此,提出一个设想,对于机器学习的方法之间的结合与本身的改进,再加入规则的制定,能够提高机器对情感句子的分析准确率。对于模型应用之前的特征提取的方法进行比较选取,通过特定的特征选取方式使得构造向量空间更加准确,再通过比较不同分类算法进行比较选取。 长型评论类别。该类评论句子种类各异,并且干扰句子也颇多。一条评论中的句子和句子之间会建立联系并互有干扰机器学习方法研究-数控滚圆机滚弧机折弯机张家港电动液压滚圆机滚弧机倒角机,所以倾向性分析更加难以辨别判断,尤其是对于社会类事件情感的分析,因为其中句式和词频都比较复杂。2.3向量空间大小确定首先,确定向量空间的大小,观察每次实验结果的准确率,确定一个临界值本文由公司网站滚圆机网站 转摘采集转载中国知网整理!   http://www.dapengkuoguanji.com/ ,可以看出高频词在700词左右,准确率则提升到一个最高点,然后基本维持稳定,由此可以确定在训练集不变的情况下,700词左右已经是分类器能够探索得到的最好的情况。示例如图4所示。图4Unigram词频统计影响示例Fi提取特征方法的选取通过上述实验的测试,证明Unigram和SVM模型的应用方向是正确的,而用COAE2014公测数据导入实验求证模型的效果,可知效果并未臻至优等。追本溯源,准确率不高的原因可能在于提取向量特征的方面未能达到足够准确。首先,对于仅用Unigram一元词频统计、且探索研发训练集的高频词在其准确性上仍有待商榷,应该将高频词中没有出现的,而情感词库却具备的词进行补充,这样才能使囊括的范围更趋系统完善。其次,对于向量特征的提取仅仅用1和0这种布尔型分布来表示词在评论中的贡献程度也未可堪称准确,选取一个较为准确的特征向量提取方法即显示出其重要价值与意义。实验过程中,选取了3种向量提取的方法,分别为TF-IDF、互信息、统计等方式来实现文本特征提龋各类方式的实验结果如表1所示。表1特征提取方式实验结果Tab.1R类型选用的模型ACC准确率/%TF-IDFSVM模型68.89互信息SVM模型64.91统计SVM模型65.46由表1可见,3种方法的设计功能作用可阐释分述如下。机器学习方法研究-数控滚圆机滚弧机折弯机张家港电动液压滚圆机滚弧机倒角机本文由公司网站滚圆机网站 转摘采集转载中国知网整理!   http://www.dapengkuoguanji.com/