你已经明白为什么遵守数据隐私法规很重要了吧?那么你公司的数据收集标准呢?它们是否达到了标准?
以下部分将帮助你采取预防措施,确保你的数据收集操作100%符合道德规范:
- 符合道德规范的代理提供商清单
- 在数据收集领域开创道德先河
- 超越道德的前沿数据收集技术
符合道德规范的代理提供商清单
无论你选择使用哪种数据收集提供商,确保该提供商道德规范,合法获取其对等体,并能够处理符合你业务需求规模的数据收集,这一点非常重要。
以下是一个7部分的清单,你应该仔细审查并使用它来评估你正在考虑使用的每个代理/数据收集提供商:
第1条:代理来源 – 询问:“你的公司如何获取其住宅代理和移动IP?”
合法的数据收集网络和代理提供商会很乐意向你提供具体的对等网络应用程序和软件名称。
第2条:对等同意 – 询问:“你是否要求对等同意使用他们的IP,并告知他们他们的设备正在作为商业代理网络的对等体使用?”
获得真实的住宅和移动IP的唯一合法和道德手段是通过知情用户同意。
第3条:退出选项 – 询问:“你的对等体是否能够随时轻松退出网络?”
毫无疑问,强迫对等体作为数据收集对等网络的成员是不道德的。
第4条:GDPR和CCPA合规 –询问:“你从对等体那里收集哪些个人身份信息(PII)?你是否按照GDPR指南处理PII?”
法律合规在大多数情况下是道德的基本原则。确保你正在考虑使用的提供商在国际数据保护法方面是合规的。
第5条:对等补偿 –询问:“你如何补偿对等体参与你的代理网络?”
任何想从个人资源中受益的企业都应该为每个参与者提供足够的补偿。在这种情况下,确保用户通过免费会员升级、无广告体验等方式获得公平补偿。
第6条:空闲资源 – 询问:“你对通过对等设备路由流量的条件是什么?你是否只在设备空闲且有足够电量时使用对等体的资源?”
真正关心其网络参与者福祉的数据收集公司绝不会为了路由代理网络流量而牺牲对等体的用户体验。
第7条:SDK终止 – 询问:“当使用供应商SDK的应用程序被卸载时,SDK是否也会被卸载?”
合法的代理提供商会确保其SDK在包含它的应用程序从对等设备中卸载后也被卸载。
这是一个非常准确且易于应用的系统,用于评估任何给定的数据收集/代理提供商的道德和法律合规性。请注意,只有在上述7个部分中获得7/7评分的提供商才应使用,因为未能遵守其中任何一部分都可能使你的数据收集和业务面临严重风险!
这里有一个比较图表,我们已经为你的方便制作成PDF格式供下载:
图片来源:Bright Data
在数据收集领域开创道德先河
从一开始,Bright Data就将道德数据收集实践的重要性置于公司DNA的核心。事实上,该公司的一个主要使命声明是:创建一种公平和道德的数据收集手段,以增加竞争,从而使企业和消费者都受益。Bright Data是一家非常注重行动的公司,这就是为什么它的使命声明从成立第一天起就被付诸实践,包括:
IP采购 – 通过对等程序如EarnApp以公开和自愿的方式进行。
“Bright Data悬赏计划” – 邀请公众发现并提醒Bright Data任何潜在的安全漏洞。
退出承诺 – 对等体可以随时退出,并有Bright Data的承诺,应用程序和SDK将完全从合作伙伴设备中删除。了解更多关于“是什么让我们的SDK符合道德?”
第三方审核 – Bright Data不断与领先的独立公司合作,确保其网络符合法规、安全和法律标准。
质量优先于数量 – Bright Data仔细筛选其SDK合作伙伴,这些合作伙伴是其大多数对等体的来源,以确保只有最高质量的对等体参与Bright Data网络。这反过来保证了网络用户的安全。
数据为所有人服务 – 从自动数据解锁技术到数据收集自动化,Bright Data积极努力使数据成为所有人都可以访问的商品(不仅仅是大公司)。
道德入驻 – Bright Data努力确保其对等网络不仅道德和合规,而且所有当前和未来的网络用户只利用网络用于合法和道德的用例。这包括严格的了解你的客户(KYC)流程、持续的使用日志检查以及专门的合规官员和团队。
零IP转售政策 – Bright Data有零IP转售政策。期。由于IP转售是代理网络行业中一种不道德 的普遍做法,这一点非常重要。当一个IP被转售时,可能会出现一种荒谬的情景,即一家公司向两个不同的提供商支付费用以使用同一个IP,但得到的是次优结果。
超越道德的前沿数据收集技术
与Bright Data的首席技术官Ron Kol进行的一对一对话揭示了其技术进步如何引领商业社区进入数据收集的未来。
问: 从技术角度来看,代理网络中最重要的因素是什么?IP池的大小是否仍然像过去那样重要,还是行业正朝着不同的方向发展?
答: 池的大小仍然很重要,但已经不足以保证成功。网站开始不仅仅在网络层(IP)上进行阻止,还在协议层(SSL、HTTP)和浏览器层(用户指纹)上进行阻止,获取甚至是公开信息变得越来越困难。对于已经在这些层次上部署了阻止的网站,成功率将急剧下降。更高级别的服务 – 如Bright Data的Web Unlocker、Web Scraper API和无服务器函数工具 是获得良好成功率所必需的。
问: 你认为现在以及未来十年数据收集技术面临的最大挑战是什么?
答: 目前最大的挑战是如何将公共数据收集商品化。如何建立大规模的高质量验证数据的可靠公共数据收集平台,并使其对所有人都可访问,而不仅仅是工程师。
展望未来,技术挑战将是创建一个索引的公共信息聚合数据库,使你可以像在Google上进行搜索一样轻松地查找任何网站的任何公共信息数据集。将公共互联网映射为业务可用的数据集,使其透明并对所有人可访问。
总结
无论你选择如何获取数据,确保其道德合规且合法是很重要的。在客户端进行自己的独立尽职调查与在数据收集和代理网络端一样重要。当你做足功课,确保推动你业务的数据引擎运行良好时,才能确保长期内业务表现最佳。获取下一代数据收集技术也不会有任何损害。