如何使用Photon高效率提取网站数据
选项 -s 或 –seeds,使用示例:
你可以使用此选项添加自定义子URL,要以逗号分隔。 指定user-agent(s)选项 –user-agent,使用示例:
你可以使用此选项使用自己的用户代理,以逗号分隔。此选项仅用于帮助用户在不修改默认user-agents.txt文件的情况下使用特定用户代理。 自定义正则表达式模式选项 -r 或 –regex,使用示例:
通过使用此选项指定正则表达式模式,可以在抓取期间提取字符串。 导出格式化结果选项 -e 或 –export 通过 -e 选项,你可以指定要保存文件的输出格式,使用示例:
目前支持的格式:json 跳过数据提取选项: –only-urls,使用示例:
该选项会跳过提取js文件等数据,当你只需要抓取目标时,该选项可以派上用场。 更新选项 –update,使用示例:
如果使用此选项,Photon会检查更新。如果有新的版本,Photon会下载并将更新文件合并到当前目录中,Photon不会覆盖其他文件。 Ninja模式选项 –ninja 此选项启用Ninja模式。在该模式下,Photon会使用以下网站代表你发出请求。
转储DNS数据选项 –dns,使用示例:
创建显示目标域名的DNS数据的图像。目前不支持目标是子域。 【编辑推荐】
点赞 0 (编辑:PHP编程网 - 黄冈站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |