本文介绍了使用 LlamaCloud 和 LlamaIndex 进行文档解析,以提取如英国邮政编码、IP 地址、电子邮件地址、银行详细信息等敏感信息的方法,用于欺诈检测和数字取证。通过 GenAI 引擎,可以从各种格式的文档中提取信息,并展示了使用 LlamaExtract 提取信息的代码示例。文章还评估了使用不同配置的成本和输出结果。
本文探讨了两种保护隐私的机器学习方法:同态加密和联邦学习,并将其应用于欺诈检测。同态加密允许在加密数据上进行计算,而无需解密;联邦学习则允许多方在不共享原始数据的情况下协同训练模型。文章介绍了使用这两种技术进行信用卡欺诈检测的实践案例,包括使用OpenFHE库和联邦学习系统Starlit。
L2BEAT发布了一个数据可用性(DA)解决方案的风险评估框架,旨在评估不同DA解决方案的安全性。该框架从经济安全、欺诈检测机制、证明安全性、退出窗口和可访问性五个方面对DA解决方案进行分级评估,并邀请社区提供反馈以完善该框架, 从而帮助L2用户了解不同DA提供商的风险情况。
本文探讨了在保护用户隐私的前提下改进机器学习应用的方法,重点介绍了同态加密和联邦学习在欺诈检测中的应用。文章讨论了使用同态加密对数据进行加密处理,然后在加密状态下进行机器学习模型训练和推理,以及利用联邦学习在不共享原始数据的情况下,通过多个参与方协作训练模型。