基于第二代自动标点模型(T2),实现给古汉语文本自动标注现代标点。
这次开放的API为无概率分布版本,返回结果不包含标点的概率分布信息,与古籍酷网站不同。每次可以标点多达10000个汉字,原有标点不会给标点结果造成影响,不作清理也可以。
HTTP 方法:POST
请求URL:https://punct.gj.cool/punct/test
Header声明如下:
参数 | 值 |
---|---|
Content-Type | application/json |
Body请求示例:
[{"src":"曲禮者。古禮篇之名。禮記多以簡端之語名篇。此篇名曲禮者。以篇首引之也。"}]
Body中放置请求参数,参数详情如下:
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
src | 是 | string | - | 整个JSON字符串含有一个src元素。 |
若请求成功,服务器返回的JSON文本将包含以下参数:
字段 | 是否必选 | 类型 | 说明 |
---|---|---|---|
pred_sent | 是 | array | 对应自动标点后的文本 |
HTTP/1.1 200
Pragma: no-cache
Cache-Control: no-cache
Content-Type: application/json;charset=UTF-8
Transfer-Encoding: chunked
Date: Thu, 08 Nov 2018 12:34:01 GMT
[{
"pred_sent": "曲禮者,古禮篇之名。禮記多以簡端之語名篇,此篇名曲禮者,以篇首引之也。"
}]
1、我们无法保证自动标点API在长期连续运行下的稳定性,所以不建议其它开发者基于此API进行商业化开发。
2、当服务器总体日均负载量低于100万字/日时,我们欢迎所有使用者自由免费使用自动标点API服务。
3、总体日均负载量超出100万字/日以后,基于继续向广大用户提供稳定服务的考虑,我们将会要求API使用者向我们申请专用的调用地址,我们视情况给予不同的每日免费使用额度。届时,我们还将回收所有古籍酷VIP账号,统一降级为高级账号(每日10万字使用量),敬请谅解。
4、一旦出现任何恶意或不合理使用(例如大量标注现代文)的迹象,我们将无预警的采取屏蔽IP等各种必要措施,敬请谨慎合理使用。
我们不对用户在使用本API时因其自身原因而导致的本人或其他第三方的任何物质或精神损失承担连带责任。
截止4月23日,总使用量:1100万字。每百字标点数:16.0。
4月17-23日,日均负载量:26.9万字/日,最大日负载量:48.9万字/日。