X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
帮助与支持
欢迎来到思明网上知识产权交易平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[00287966]一种MapReduce并行化大数据文本分类方法

交易价格: 面议

所属行业: 网络

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:201510297189.X

交易方式: 完全转让

联系人: 刘姣姣

进入空间

所在地:陕西西安

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

一种MapReduce并行化大数据文本分类方法,包括如下步骤:第一步:建立用于文本分类的基准测试数据集,进行数据预处理,包括分词、去停用词、词根还原;将该基准测试数据集随机划分为训练文本和测试文本,将所述基准测试数据集采用向量空间模型建立文本表示模型;第二步:根据上述文本表示模型采用CDMT对所述基准测试数据集进行特征选择;第三步:采用贝叶斯分类器对所述基准测试数据集进行训练学习,得到分类结果。本发明提供一种分类性能良好、区分度较高的MapReduce并行化大数据文本分类方法。

推荐服务:

平台简介|运营商简介平台创新|联系我们

Copyright © 2013 , All Rights Reserved.海峡科技网_思明网上知识产权交易平台 版权所有

运营商:厦门市第五批双百人才计划企业——厦门科易通宝网络科技有限公司

闽ICP备13013242号-2

在线客服系统