add ci rank

This commit is contained in:
xinglie.lkf
2019-07-29 17:59:45 +08:00
parent 55e275742f
commit 7ca8bd8032
24 changed files with 168793 additions and 0 deletions

35
rank/README.md Normal file
View File

@@ -0,0 +1,35 @@
诗词搜索结果
-----
根据该[关于诗词的知名度](https://github.com/chinese-poetry/chinese-poetry/issues/115)整理的数据以“作者作品名”做为搜索关键字通过搜索引擎搜索并把搜索结果数量做为排行的一个维度制作而成目前收集了“百度、必应、360搜索和谷歌”等`4`个引擎的数据
一般来讲,搜索结果越多,表示该诗词越知名。
## 说明
该目录下收集了`ci``json`两个文件夹下的诗词搜索数据,且该文件夹下的文件与`ci``json`中的文件一一对应,比如`./ci/ci.song.rang.8000.json`对应`../ci/ci.song.8000.json`
不但文件一一对应,文件中的内容也是一一对应的,即`./ci/ci.song.rang.8000.json`中数组中的第`n`条和`../ci/ci.song.8000.json`数组中的第`n`条对应
Q: 为什么没有把该结果和诗词数据放在一起?
A: 为了保持诗词数据的纯洁,并非所有数据都适合塞进去。对于这种非所有人需要的数据,通过一一对应关系,可以很方便的给原诗词扩展数据,同时也保证了原诗词的纯洁度。所以当需要对诗词根据知名度排序的需求时,可以把该数据附加到原有诗词数据上即可。
## 数据形式
每个 JSON 文件1000条记录. 为了举例, 删除了余下999条.
```js
[
{
"author": "石孝友",
"rhythmic": "玉楼春",
"baidu": 77500, //百度搜索结果条数
"so360": 1060,//360搜索结果条数
"google": 991000,//谷歌搜索结果条数
"bing": 20//必应搜索结果条数
}
]
```
搜索引擎的结果数据仅供参考,不同时间搜出来的数据未必一致