在这篇文章中,我们将探讨:
- 在大金融背景下整合替代数据的关键障碍是什么?
- 金融机构如何在面临挑战的情况下蓬勃发展
最近发布了一份新的金融行业调查。美国和英国的100名来自贷款、对冲基金、银行和保险领域的专业人士参与了调查。报告强调了大多数金融机构理解需要依赖外部数据来源这一事实。然而,该动态行业中的大部分机构没有内部知识和专业技能来正确分析替代数据,并真正获得运营利益。本文关注行业参与者当前面临的挑战以及使用的技术应对机制。
在大金融背景下整合替代数据的关键障碍是什么?
“在大金融背景下,替代数据整合的关键障碍包括分析层面的问题,61%的受访者*认为这是他们最可能面临的挑战,而53%的人认为数据来源/采购是主要挑战。”
金融行业替代数据分析的主要障碍
根据调查结果:
“64%的金融服务专业人士*将替代数据用于制定其持续投资策略。”
但是,当投资组合经理开始获取数据时,问题就开始出现:
- 来自多种来源的数据
- 数据量极大
数据分析团队也面临挑战,尤其是与所收集的数据质量和兼容性相关的问题。这对半结构化和非结构化数据尤其如此,这类数据很难与具有独特预设的数据交易模型整合。这是许多金融机构缺乏有效处理和交叉参考替代数据集的网络基础设施的核心问题。
此外,缺乏掌握最新数据收集和处理技术的熟练劳动力,正在为金融行业各家公司制造障碍。
最后,金融机构发现越来越难以实现他们自己设定的数据灵活性标准。他们收集目标数据并将其存储在类似苏必利尔湖大小的库中,但仍然无法将其去上下文化,从而得出更大图景的结论,这可以带来更有意义的货币化机会。
关键数据来源挑战
数据分析的困难在某种程度上与数据来源的障碍相互关联并重叠。最大的数据来源挑战包括:
数据识别 – 这意味着能够根据使用案例和资产类别识别和分类组织保留元数据的数据集,这可能对操作产生重大影响。
过程可复制性 – 许多时候,团队能够因为某些信息上线或其他特殊情况而获得一次性数据集。然而,公司需要可靠和稳定的数据流。
信息质量 – 人工智能和机器学习有一个重要的“训练阶段”,在这一阶段它们需要提供干净且可追溯的数据,以确保输出高质量和准确性。例如,时间延迟或地理文件损坏可能会严重损害算法的洞察力,如关闭哪些证券头寸以及何时退出。
分散的来源 – 数据并非都来自同一地方或以相同格式。一些数据可能来自社交平台,而其他数据可能来自搜索引擎结果和/或证券交易委员会(SEC)文件。格式可以从视频和语音文件到文本和系统日志不等。将这些数据聚合并交叉参考到统一系统中可能具有挑战性。
金融机构如何在面临挑战的情况下蓬勃发展
越来越多的金融机构开始意识到外包其数据收集需求的好处。这可以通过购买现成的数据集或通过提供自动化、实时数据流的工具来实现。
这种方法消除了分析阶段的大多数挑战,因为数据收集网络能够:
- 根据公司的具体需求定制数据集
- 确保输入/输出符合所需文件格式,从而更轻松地整合来自不同来源的数据
- 帮助您避免投资昂贵的数据系统和数据收集专家
- 赋予您的基金按项目启用和关闭数据收集操作的灵活性(通常称为“按需数据”)
这种方法对于希望专注于数据驱动投资而不让数据收集占据大部分时间的小型精品办公室来说也是一个明智的选择。
在金融服务和投资背景下,将数据视为商品的关键好处包括:
获取实时、低延迟的数据流,以通知即时操作决策(买入、卖出、做空等)
使人工智能和机器学习的培训和定制更加容易,使创建和测试快速交易模型对团队成员来说变得自然而然
快速、无痛地扩大或缩小运营规模
消除购买/开发昂贵硬件、软件和专有协议/API的需求
解锁难以获取或故意不可发现的数据集,例如使用指定代码片段隐藏程序费率的美国医院
底线
替代数据的收集和实施在金融行业仍处于“采用阶段”,这意味着仍有获得显著“信息优势”的空间。
尽管大多数机构知道利用外部数据可以获得很多好处,但许多机构缺乏正确分析和利用这些数据的能力或专业知识。
因此,数据价值链与大多数其他信息商品在数量、成本、质量和输出方面有着反向关系。例如,收集少量高质量结构化数据,自动传递给投资模型、算法和分析师的投资回报率(ROI)要比从不同来源和格式收集的大量非结构化数据要高得多。
因此,金融公司和金融科技公司需要有一个明确的数据收集和治理策略,其中包括数据来源自动化,从而实现更好的资产管理和投资组合结构。
* 这些数据基于那些在受访者中使用替代数据的组织。