P大树洞:只能搜到近100条内容 - 网络技术(Networking)版 - 北大未名BBS
返回本版
1
/ 1
跳转

P大树洞:只能搜到近100条内容

[复制链接]
楼主

doctorapri [离线]

xiaoye

2.2一般站友

发帖数:122 原创分:0
<ASCIIArt> 1楼

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

发表于2022-01-19 11:21:03

IlIl [离线]

戒网又失败了

4.4维尼熊

发帖数:3234 原创分:0
<ASCIIArt> 2楼

还有这条树洞也搜不到,麻烦相关维护人员看一下是什么bug

https://pkuhelper.pku.edu.cn/hole/##1282115

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

签名档


发表于2022-01-19 13:47:43

lcdlyxrqy [离线]

忘川蒿里|小落叶

8.9宇宙

发帖数:2.7万 原创分:2
<ASCIIArt> 3楼

树洞来这发帖有啥用……

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

发表于2022-01-19 14:51:52

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 4楼

盲猜是被删洞了

IlIl (戒网又失败了) 在 ta 的帖子中提到:

还有这条树洞也搜不到,麻烦相关维护人员看一下是什么bug

https://pkuhelper.pku.edu.cn/hole/##1282115

发表于2022-01-19 15:58:50

bestillstill [离线]

岸上拔丝一动不动

6.7四暗刻

发帖数:3701 原创分:4
<ASCIIArt> 5楼

既然是洞,那应该是被填了,这个洞就没了( •̀ ω •́ )✧

Bigscience (Doublefire.Chen) 在 ta 的帖子中提到:

盲猜是被删洞了

签名档


功夫再高,也怕断幺

但我连断幺也不会啊(;´༎ຶД༎ຶ`)

发表于2022-01-20 12:30:26

mintcandy [在线]

已黑化

3.7树袋熊

发帖数:932 原创分:1
<ASCIIArt> 6楼

几年前是可以搜索到全部内容的,后来改策略了,原因未知。再改回来可能性很小吧


何况楼主问的是怎么爬数据,那估计更不会有管理员理你了23333

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

 最后修改于2022-01-20 12:55:31
  • 发表于2022-01-20 12:55:12

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 7楼

要是楼主真的想爬数据,建议楼主赶紧把帖子删了吧,省得NaH整一个反爬虫策略,到时候写代码就麻烦喽

mintcandy (已黑化) 在 ta 的帖子中提到:

几年前是可以搜索到全部内容的,后来改策略了,原因未知。再改回来可能性很小吧


何况楼主问的是怎么爬数据,那估计更不会有管理员理你了23333

发表于2022-01-20 13:16:47

outerform [在线]

outerform

2.6主序星

发帖数:60 原创分:0
<ASCIIArt> 8楼

大概。。就是不想让你看没有现实意义的历史树洞而已

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

发表于2022-01-20 14:09:48

woctordho [离线]

pkuhollow.com新树洞

3.1中级站友

发帖数:236 原创分:0
<ASCIIArt> 9楼

在网上搜“P大树洞备份”可以看到2020年之前的所有树洞,网上的东西是不会消失的

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

发表于2022-01-20 17:27:42

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 10楼

细🔒

woctordho (pkuhollow.com新树洞) 在 ta 的帖子中提到:

在网上搜“P大树洞备份”可以看到2020年之前的所有树洞,网上的东西是不会消失的

发表于2022-01-20 17:43:49

woctordho [离线]

pkuhollow.com新树洞

3.1中级站友

发帖数:236 原创分:0
<ASCIIArt> 11楼

对了,现在有一个树洞备份的项目还在运行,有更好的想法可以直接跟作者联系

https://github.com/SparkingIdea/PHB

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

发表于2022-01-20 18:39:34

redhated [离线]

小红帽

4.2护卫舰

发帖数:2430 原创分:0
<ASCIIArt> 12楼

历史文件不具有现实意义

doctorapri (xiaoye) 在 ta 的帖子中提到:

如题,在P大树洞https://pkuhelper.pku.edu.cn/hole/搜索某些热门关键词(如“gsm”)时,只能搜索到时间最近的约一二百条信息。

而更早期的树洞也是非常具有参考价值的,希望管理者开放搜索权限。

或者大家有什么爬取更早期树洞的好办法吗?

签名档

真正的人,总会找到他的同伴的。

发表于2022-01-21 11:18:45

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 13楼

我之前也想做这个项目,现在看来不需要我了,哈哈哈

woctordho (pkuhollow.com新树洞) 在 ta 的帖子中提到:

对了,现在有一个树洞备份的项目还在运行,有更好的想法可以直接跟作者联系

https://github.com/SparkingIdea/PHB

发表于2022-01-21 13:15:14
楼主

doctorapri [离线]

xiaoye

2.2一般站友

发帖数:122 原创分:0
<ASCIIArt> 14楼

这个很棒!但我发现:keyword只能搜英文诶 搜中文没有结果 不知道为什么

woctordho (pkuhollow.com新树洞) 在 ta 的帖子中提到:

对了,现在有一个树洞备份的项目还在运行,有更好的想法可以直接跟作者联系

https://github.com/SparkingIdea/PHB

发表于2022-01-26 23:38:31

woctordho [离线]

pkuhollow.com新树洞

3.1中级站友

发帖数:236 原创分:0
<ASCIIArt> 15楼

GitHub上的搜索对中文的支持不太好,还不如自己下载到本地然后搜

doctorapri (xiaoye) 在 ta 的帖子中提到:

这个很棒!但我发现:keyword只能搜英文诶 搜中文没有结果 不知道为什么

发表于2022-01-27 03:41:12
楼主

doctorapri [离线]

xiaoye

2.2一般站友

发帖数:122 原创分:0
<ASCIIArt> 16楼

受教了!非常感谢!

woctordho (pkuhollow.com新树洞) 在 ta 的帖子中提到:

GitHub上的搜索对中文的支持不太好,还不如自己下载到本地然后搜

发表于2022-01-29 17:24:51

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 17楼

终于检索到你这个回帖了,之前有印象根据你这层楼访问过这个repository,可惜的是忘记star了,今天看别人帖子想起了这个好东西,可是怎么也想不起来地址了,花了半天检索终于找到了,已将本楼收入个人文集,现在就去github点亮star

woctordho (pkuhollow.com新树洞) 在 ta 的帖子中提到:

对了,现在有一个树洞备份的项目还在运行,有更好的想法可以直接跟作者联系

https://github.com/SparkingIdea/PHB

签名档

There must be such sequence in my genome:(coding strand, from 5' to 3')

(C/G)GGTAGTAGATCCTCTAGGTCGAGTGA

发表于2022-04-20 13:29:38

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 18楼

可恶,404了,是这个repository被拿下了吗?求新地址

woctordho (pkuhollow.com新树洞) 在 ta 的帖子中提到:

对了,现在有一个树洞备份的项目还在运行,有更好的想法可以直接跟作者联系

https://github.com/SparkingIdea/PHB

签名档

There must be such sequence in my genome:(coding strand, from 5' to 3')

(C/G)GGTAGTAGATCCTCTAGGTCGAGTGA

发表于2022-04-20 13:31:31

Bigscience [在线]

Doublefire.Chen|测试ing

2.4主序星

发帖数:1605 原创分:0
<ASCIIArt> 19楼

后悔了,当时就应该fork的😭😭😭

Bigscience (Doublefire.Chen|爱折腾) 在 ta 的帖子中提到:

可恶,404了,是这个repository被拿下了吗?求新地址

发表于2022-04-20 13:34:51
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入