视频一区二区三区在线播放_亚洲一区动漫_www.69色_欧美片一区二区_91午夜视频_99综合视频

基于均值漂移算法的文本聚類數目優化研究

趙華茗; 余麗; 中國科學院文獻情報中心; 北京100190

關鍵詞:均值漂移 文本聚類 聚類數 聚類有效性 

摘要:【目的】探索最佳文本聚類數目的優化方法,為提升文本聚類算法的有效性和質量提供參考?!痉椒ā拷Y合TF-IDF和Word2Vec算法,提取TopN關鍵詞向量作為語料庫文本特征表達;結合均值漂移算法、聚類有效性指標(Silhouette)和均方誤差(MSE)指標,確定最佳文本聚類數目?!窘Y果】Top 4 500關鍵詞向量規模能較好呈現文本特征;基于均值漂移算法確定的最佳文本聚類數與人工研判優化的聚類數相符。【局限】選取的實驗數據集合不夠充足,缺少在其他領域的應用對比。【結論】本文方法可以在無監督方式下高質量完成文本聚類個數的確定。

數據分析與知識發現雜志要求:

{1}所有作者的作者簡介(姓名、工作單位、職稱、研究方向);通訊作者請再提供電子郵箱。

{2}稿件文責自負。編輯部有權對來稿進行文字和技術性刪改,對實質性內容的修改,則應征求作者同意。

{3}標題序號:可按四級小標題的格式寫:一、(一)、1、(1);一級、二級標題另起段,正文另起段;三級、四級小標題另起段,但正文接排;正文內序號用①……②……等。

{4}參考文獻:(1)正文格式:作者,發表年(多版次文獻請同時提供第 1 版的發表時間),頁碼,外加圓括號。(2)文末格式:中、外文獻分開,各按音序排列。

{5}摘要應反映論文的目的、方法及主要結果、結論,并充分反映論文的創新點,表達簡明、語義確切,以100 ~300 字為宜。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

數據分析與知識發現

CSSCI南大期刊
預計1-3個月審稿

期刊主頁
相關期刊
我們的服務
主站蜘蛛池模板: 欧美日韩精品综合 | 91视频欧美| 一区二区三区日韩欧美 | 亚洲一二三四区电影 | 高清不卡一区二区 | 日韩一区二区三区免费 | 欧美一a一片一级一片 | 国产精品久久毛片av大全日韩 | 91久久国产综合久久蜜月精品 | 在线观看日韩av | 在线观看日韩一区 | 亚洲乱码国产乱码精品精98午夜 | 精品久久久久久久久久久久久久久 | 天堂成人国产精品一区 | 亚洲欧美在线免费 | 网曝91综合精品门事件在线 | 熟女毛毛多熟妇人妻aⅴ在线毛片 | 中文字幕一区二区三区在线视频 | 青青国产精品 | 久久最新网址 | 精品国产欧美一区二区三区成人 | 精品视频在线免费观看 | 欧美精品成人一区二区三区四区 | 99久久久久国产精品免费 | 日韩免费久久 | 久久久久亚洲综合 | 国产精品亚洲一区二区三区在线 | 成人在线一区二区三区 | 99国产精品一区 | 亚洲精品3区 | 一区二区三区在线视频播放 | 精品国产麻豆 | 欧美不卡视频 | 美女一级黄色毛片 | 国产精品久久久久久久久久久不卡 | 一区二区色 | 国内精品国产成人国产三级粉色 | 成人看片网 | 黄色毛片网站 | 天天操操| 欧美一级黄色片子 |