垃圾内容发布者通常会利用开放评论表单和其他用户生成的内容攻击未设防的网站,在网站上生成垃圾内容。托管平台可能同样面临滥用风险;垃圾内容发布者可能会创建大量不遵循网络垃圾政策的网站,并且生成对网络价值不大或毫无价值的内容。
防止平台或网站上出现滥用行为通常并非易事。简单的障碍(如要求用户在与您的资源互动之前必须完成不寻常的难题)也可能会阻止垃圾内容发布者。
告知用户,不得通过您的服务发布垃圾内容 #
发布明确的滥用行为防范政策,并将其传达给用户,例如在用户注册过程中显示这些政策。此外,允许受信任的用户在看到您资源上的垃圾内容时进行举报。
找出发布垃圾内容的帐号 #
记录用户平台注册以及与您的平台相关的其他用户互动情况,尝试识别典型的垃圾内容模式,例如:
- 表单填写时间
- 从相同 IP 地址范围发送的请求数
- 在注册过程中使用的用户代理
- 在注册过程中选择的用户名或其他通过表单提交的值
这些信号可帮助您打造用户声望系统,这不仅可以帮助提高用户活跃度,还有助于辨别垃圾内容发布者。许多垃圾评论发布者都希望其内容出现在搜索引擎中,因此,您可以考虑向在您的平台上没有任何声望的新用户发布的帖子添加 noindex robots meta 标记。然后,在用户获得一定声望之后,再允许其内容被编入索引。这会大大降低垃圾内容发布者与您的平台互动的积极性。
由于垃圾内容发布者通常会设法留下指向其网站的链接,因此请考虑为不受信任的内容中的所有链接添加 nofollow 或 ugcrel 属性。
针对可疑的用户互动采用人工审批机制 #
针对某些用户互动采用人工审批(或审核)机制可以防止垃圾内容发布者立即创建疑似垃圾内容,从而大幅减少平台上的垃圾内容。 审核机制会增加日常工作流的开销,但这是抵御网络垃圾的一种非常有效的方法。鉴于这种机制非常有效,大多数 CMS 内置了评论审查等功能。
使用屏蔽名单防止有人重复发布垃圾内容 #
只要找到一份垃圾个人资料,再找其他的就轻松多了。例如,如果您发现有多份垃圾个人资料都来自同一个 IP 地址,则可以将该 IP 地址添加到永久屏蔽名单。对于 CMS(例如 WordPress),Akismet 等插件可以提供帮助,将 IP 地址添加到防火墙的拒绝列表有时也是非常有效的方法。
禁止自动创建帐号 #
考虑在注册表单中采用人机识别系统或类似的验证工具,仅允许真人提交表单,从而防止自动化脚本在您的托管服务上生成大量网站。
监控您的服务是否存在滥用行为 #
- 监控您的资源是否有出现垃圾内容的迹象,例如重定向、大量的广告块、某些垃圾内容关键字以及大段的已编码 JavaScript 代码。site: 搜索运算符或 Google 快讯可帮助您检测问题。
- 请留意网络服务器日志文件中是否突然出现流量激增。
- 监控您的资源是否存在钓鱼式攻击网页和感染了恶意软件的网页。例如,您可以使用 Google Safe Browsing API 定期测试相应服务中的网址。
- 进行一些可信度检查。举例来说,如果您的网站以日本用户为主要目标受众,那么在一夜之间,来自意大利 IP 在您资源上进行数千次用户互动的几率会是多少。许多工具可用于检测新创建的网站的语言,例如语言检测库或 Google Translate API v2。