查看: 875|回复: 24

[网站源码] 全新热搜热门榜内容系统聚合源码

[复制链接]
发表于 2023-4-18 15:04 | 显示全部楼层 |阅读模式
非法程序、 2023-4-18 15:04 875 24 显示全部楼层
1.前端纯HTML+JS+JSON(链接统计除外),后端python生成标准JSON

2.自带30几个常用网站采集规则

3.多线程抓取,30+网站5秒内采集完毕

4.相同网站放在一个框架内,可局部刷新和滚动

5.更新时间显示(按采集页的自带更新时间或按时间排序的第一条时间采集,

没有的为采集完成时间)

6.内容链接防盗链,链接通过base64+字符逆序+大小写反转+base64实现加密

(更换大小写转换顺序或增加数字替换可实现不同密码加密)

7.内容链接点击统计

8.部分内容鼠标悬停提示(如appstore排行有更新内容、时间、版本号)

安装:

1.python3 caiji.py采集(保持后台运行请用screen或nohup)

2.打开首页访问

注:

caiji.py为后端采集程序,其余为前端需在同一目录 相应设置修改请查看源码中的注释

admin.php为第三方数据库管理程序,用于内容链接统计查看(默认密码admin,请在文件中修改)

点击统计数据库log.db会在首次访问内容链接时生成,如未建立请保证主目录可写

为了安全,后端程序caiji.py和数据库查看程序admin.php请改为复杂文件名,

或移动到非web目录(需同时修改文件内的生成json保存目录为网站根目录,默认为当前目录)

默认使用多线程抓取,如有问题请改用单线程 今日头条的采集请更换为自己的cookie,

头条短时间采集内容相同的太多(目前1分钟采一次合并10次数据),

相同cookie分段采集后几乎不会有重复的,

但采集一段时间后推荐的都是杂七杂八无关的垃圾内容

(请定期更换cookie或自行加入随机的头条cookie生成规则)

采集站的logo大部分已修改为透明图层png,在非白色背景下可能会很难看
游客,如果您要查看本帖隐藏内容请回复


20230418103814671467.jpg
发表于 2023-4-18 16:00 | 显示全部楼层
mygs 2023-4-18 16:00 显示全部楼层
好像又被你耍了好像又被你耍了好像又被你耍了好像又被你耍了
回复

使用道具 举报

发表于 2023-4-18 17:04 | 显示全部楼层
bhshuya 2023-4-18 17:04 显示全部楼层
感谢楼主分享!
回复

使用道具 举报

发表于 2023-4-18 18:34 | 显示全部楼层
锄禾日当午,回帖真辛苦
回复

使用道具 举报

发表于 2023-4-18 22:39 | 显示全部楼层
q76163820 2023-4-18 22:39 显示全部楼层
谢谢大佬,以拿了
回复

使用道具 举报

发表于 2023-4-18 22:56 | 显示全部楼层
CZTDRLMOMO 2023-4-18 22:56 显示全部楼层
签到顶贴6666
回复

使用道具 举报

发表于 2023-4-19 10:26 | 显示全部楼层
大帅逼 2023-4-19 10:26 显示全部楼层
老好用了谢谢!
回复

使用道具 举报

发表于 2023-4-19 19:15 | 显示全部楼层
xiaoqi5201 2023-4-19 19:15 显示全部楼层
鐪嬬湅鎬庝箞鏍
回复

使用道具 举报

发表于 2023-4-20 14:31 | 显示全部楼层
tanmou 2023-4-20 14:31 显示全部楼层
签到顶贴6666
回复

使用道具 举报

发表于 2023-4-22 07:19 | 显示全部楼层
az74712 2023-4-22 07:19 显示全部楼层
这个可以用吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 返回列表 发新帖

快速回复 返回顶部 返回列表