DELPHI盒子
!实时搜索: 盒子论坛 | 注册用户 | 修改信息 | 退出
检举帖 | 全文检索 | 关闭广告 | 捐赠
技术论坛
 用户名
 密  码
自动登陆(30天有效)
忘了密码
≡技术区≡
DELPHI技术
lazarus/fpc/Free Pascal
移动应用开发
Web应用开发
数据库专区
报表专区
网络通讯
开源项目
论坛精华贴
≡发布区≡
发布代码
发布控件
文档资料
经典工具
≡事务区≡
网站意见
盒子之家
招聘应聘
信息交换
论坛信息
最新加入: liangjiping168
今日帖子: 15
在线用户: 17
导航: 论坛 -> DELPHI技术 斑竹:liumazi,sephil  
作者:
男 badwood (badwood) ★☆☆☆☆ -
盒子活跃会员
2017/2/26 22:47:37
标题:
求推荐适合DELPHI的中文分词工具 浏览:2304
加入我的收藏
楼主: 准确率高、成熟稳定,方便使用 ,XE6以上环境使用。
----------------------------------------------
-
作者:
男 yzdbs (学无止境) ★☆☆☆☆ -
盒子活跃会员
2017/2/27 9:48:35
1楼: 中科院计算所的那个就不错
----------------------------------------------
┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻
┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳
┻┳┻┳┻┳learning stream media.┳┻┳┻┳┻
┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳
┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻
┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳┻┳
作者:
男 msfm (清洁工) ★☆☆☆☆ -
盒子活跃会员
2017/2/27 9:57:58
2楼: 我还真做过 中文分词
----------------------------------------------
-
作者:
男 wr960204 (武稀松) ★☆☆☆☆ -
盒子活跃会员
2017/2/27 10:26:20
3楼: 十几年前做过,准确率95%以上,还卖了点钱,呵呵
----------------------------------------------
武稀松http://www.raysoftware.cn
作者:
男 hardnut (麦轲数据管家) ★☆☆☆☆ -
普通会员
2017/2/28 10:19:43
4楼: to yzdbs: 有delphi接口吗?能分享下吗?
----------------------------------------------
UniKeeper V10.40 -- 您最贴心的个人数据管理助手
作者:
男 edwinyeah (Edwin) ★☆☆☆☆ -
盒子活跃会员
2017/2/28 10:26:33
5楼: 同求。如果能支持sqlite更棒。
----------------------------------------------
-
作者:
男 edwinyeah (Edwin) ★☆☆☆☆ -
盒子活跃会员
2017/2/28 10:30:46
6楼: 如果找不到,另外提供一个思路 - 把 golang实现的中文分词移植:
https://github.com/yanyiwu/gojieba

https://github.com/huichen/sego

改完记得分享出来啊!
----------------------------------------------
-
作者:
男 edwinyeah (Edwin) ★☆☆☆☆ -
盒子活跃会员
2017/2/28 10:44:47
7楼: ok, 估计最快的方法是,把https://github.com/yanyiwu/cjieba 这个“结巴”的c语言版用bc++编译为obj文件,在delphi里面引用。
----------------------------------------------
-
作者:
男 138soft (138soft) ★☆☆☆☆ -
盒子活跃会员
2017/2/28 11:17:25
8楼: 中科院那个很不错。不过源码写的实在让人吃惊。 if xxx && aaa && bbb.......比如说有一个判断条件这个and 多达40个。
----------------------------------------------
是你上错了车,还是我下错了站?
作者:
男 wr960204 (武稀松) ★☆☆☆☆ -
盒子活跃会员
2017/2/28 11:27:29
9楼: @138soft 
中科院的做法其实没错,本来语言就是有很大随意性,不是像计算机那样有规律。做出分词大框以后,要精细必须针对很多用法单独写
----------------------------------------------
武稀松http://www.raysoftware.cn
作者:
男 hardnut (麦轲数据管家) ★☆☆☆☆ -
普通会员
2017/2/28 11:52:06
10楼: 而且,分词这个东西,效率是非常关键的指标,如果写优雅一点,比如改成数据驱动,可能性能会下降许多
----------------------------------------------
UniKeeper V10.40 -- 您最贴心的个人数据管理助手
作者:
男 jinlifan123 (jinlifan123) ★☆☆☆☆ -
普通会员
2017/2/28 18:54:03
11楼: 我记得以前波哥弄了一个。你可以找他问问,当然最好是能赞助一下qdac.
----------------------------------------------
-
作者:
男 jinnblue (jinnblue) ★☆☆☆☆ -
普通会员
2017/3/3 10:58:45
12楼: 基于AC自动机的,已开源,
https://github.com/jinnblue/aho-corasick
----------------------------------------------
-
作者:
男 wang_80919 (Flying Wang) ★☆☆☆☆ -
普通会员
2017/3/3 11:09:03
13楼: 非常感谢楼上。
虽然下载了。
但是还没具体看。
就喜欢用新版本写的 代码。

不知道是否支持 移动平台。
----------------------------------------------
(C)(P)Flying Wang
作者:
男 wac1104 (火鸟) ★☆☆☆☆ -
普通会员
2017/3/3 12:48:11
14楼: 之前看过武稀松的封装过SCWSDelphi版的,不过不知道为啥无法使用,后来我就重新编译了scws ,改了改武稀松的pas ,经过测试可以使用效率也还不错能添加扩展词库。

http://easy.msofficegear.com/Update/scws_Delphi.7z
----------------------------------------------
火鸟
作者:
男 edwinyeah (Edwin) ★☆☆☆☆ -
盒子活跃会员
2017/3/3 14:55:20
15楼: @jinnblue, 感谢!看了一下,aho-corasick是不是只能分单个字?

@wac1104 (火鸟), 感谢!没试,词库挺大的。
----------------------------------------------
-
作者:
男 wac1104 (火鸟) ★☆☆☆☆ -
普通会员
2017/3/3 16:37:05
16楼: 如果需要代码回头我可以贴一部分测试代码,看了代码就应该知道怎么用了
----------------------------------------------
火鸟
作者:
男 badwood (badwood) ★☆☆☆☆ -
盒子活跃会员
2017/3/3 16:47:22
17楼: 火鸟:肯定要请教了,谢谢代码
----------------------------------------------
-
作者:
男 jinnblue (jinnblue) ★☆☆☆☆ -
普通会员
2017/3/3 18:53:31
18楼: 可分词。
缺点是需要预处理,比如新加关键词后需要重建Fail表,耗时较长;
如果增加不频繁关系也不大。
----------------------------------------------
-
作者:
男 edwinyeah (Edwin) ★☆☆☆☆ -
盒子活跃会员
2017/3/3 22:23:08
19楼: @jinnblue (jinnblue),
多谢回复。所以中文关键字字典要自己提供,对吗?因为我看了dictionary.txt里面好像只有英文单词。
----------------------------------------------
-
作者:
男 jinnblue (jinnblue) ★☆☆☆☆ -
普通会员
2017/3/8 23:49:00
20楼: 词组需要自己提供;
当时主要是拿来做脏词过滤的。
----------------------------------------------
-
作者:
男 wac1104 (火鸟) ★☆☆☆☆ -
普通会员
2017/3/9 8:05:25
21楼: 代码里面有词库
----------------------------------------------
火鸟
作者:
男 szlbz (秋风) ★☆☆☆☆ -
盒子活跃会员
2018/1/15 12:52:17
22楼: @wac1104 (火鸟),http://easy.msofficegear.com/Update/scws_Delphi.7z下载不了,能发到q q邮 箱吗(315795176)?谢谢!
----------------------------------------------
-
作者:
男 letianwuji (大器晚成) ▲▲▲▲▲ -
普通会员
2018/1/15 14:52:58
23楼: 中科院的那个dll,直接可以delphi 最新版调用的。
就是需要基于.h文件,写一个接口pas
----------------------------------------------
相信自己,若自己都不相信,那还有谁可信。
信息
登陆以后才能回复
Copyright © 2CCC.Com 盒子论坛 v3.0.1 版权所有 页面执行367.1875毫秒 RSS