add ci rank

2026-06-20 02:18:04 +00:00 · 2019-07-29 17:59:45 +08:00
parent 55e275742f
commit 7ca8bd8032
24 changed files with 168793 additions and 0 deletions
--- a/rank/README.md
+++ b/rank/README.md
@@ -0,0 +1,35 @@
+诗词搜索结果
+-----
+
+根据该[关于诗词的知名度](https://github.com/chinese-poetry/chinese-poetry/issues/115)整理的数据，以“作者＋作品名”做为搜索关键字，通过搜索引擎搜索，并把搜索结果数量做为排行的一个维度制作而成，目前收集了“百度、必应、360搜索和谷歌”等`4`个引擎的数据
+
+一般来讲，搜索结果越多，表示该诗词越知名。
+
+## 说明
+
+该目录下收集了`ci`和`json`两个文件夹下的诗词搜索数据，且该文件夹下的文件与`ci`和`json`中的文件一一对应，比如`./ci/ci.song.rang.8000.json`对应`../ci/ci.song.8000.json`。
+
+不但文件一一对应，文件中的内容也是一一对应的，即`./ci/ci.song.rang.8000.json`中数组中的第`n`条和`../ci/ci.song.8000.json`数组中的第`n`条对应
+
+Q: 为什么没有把该结果和诗词数据放在一起？
+A: 为了保持诗词数据的纯洁，并非所有数据都适合塞进去。对于这种非所有人需要的数据，通过一一对应关系，可以很方便的给原诗词扩展数据，同时也保证了原诗词的纯洁度。所以当需要对诗词根据知名度排序的需求时，可以把该数据附加到原有诗词数据上即可。
+
+
+## 数据形式
+
+每个 JSON 文件1000条记录. 为了举例， 删除了余下999条.
+
+```js
+[
+  {
+    "author": "石孝友",
+    "rhythmic": "玉楼春",
+    "baidu": 77500, //百度搜索结果条数
+    "so360": 1060,//360搜索结果条数
+    "google": 991000,//谷歌搜索结果条数
+    "bing": 20//必应搜索结果条数
+  }
+]
+```
+
+搜索引擎的结果数据仅供参考，不同时间搜出来的数据未必一致