工具介绍
pullword是一款老牌免费的中文在线分词API工具,国内很多网站都在使用,分词准确率高,而且免费使用。
另外pullword不光提供免费版的在线网页分词工具,而且还提供免费的分词API,也就是你还可以将pullword分词工具整合到自己的项目中。
使用方法
在线网页版:http://www.pullword.com/
API接口版:http://api.pullword.com/
褒贬分析版:http://www.pullword.com/baobian/
参数说明:
source:要分词的语句
例如:source =清华大学是好学校
param1:保留准确概率
例如:(0到1之间小数)
param1 = 0 保留所有单词
param1 = 0.5 保留准确率大于50%的单词(推荐)
param1 = 1只保留准确率为100%的单词
param2 :调试模式
解释:
param2 = 0调试模式关闭
param2 = 1调试模式打开(显示每个单词的准确概率)
JSON :可选参数
解释:
json = 1以json格式返回
json = 0不以json格式返回
Get请求方法:
http://api.pullword.com/get.php?source=基于深度学习永久免费的中文分词API——PullWord¶m1=0¶m2=1&json=0
返回结果:
基于:0.914565 于深:0.1028 深度:0.631241 深度学习:0.970203 度学:0.0528831 学习:0.932092 永久:0.837484 永久免费:0.907086 免费:0.8434 中文:0.821397 中文分词:0.925692 分词:0.171603 api:0.634708 ——:1 pullword:0.961573
post请求方法:
请求地址:
http://api.pullword.com/post.php
php示例代码:
function httpPost($url,$postData) { $ch = curl_init(); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch,CURLOPT_RETURNTRANSFER,true); curl_setopt($ch,CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_POST, count($postData)); curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); $output=curl_exec($ch); curl_close($ch); return $output;}echo httpPost("http://api.pullword.com/post.php","source=清华大学是个好学校¶m1=0¶m2=1");
特别注明:超过30个汉字的分词请求,清用get方法,不要用post方法,否则会效率低,且会出错。