и с другой стороны, если авиакомпании решат повысить свои цены независимо от каких-либо изменений цен на нефть, это повышение не должно повлиять на цены на нефть. следовательно, цены на нефть вызывают цены на авиабилеты, но не наоборот. в более широком смысле, используя причинно-следственный анализ исторических данных, можно обнаружить, что рост цен на нефть будет иметь каскадный эффект на цены на другие сырьевые товары. таким образом, одним из возможных макроэкономических средств снижения растущих цен на авиабилеты и, возможно, другие товары является увеличение поставок нефти, что, в свою очередь, приведет к снижению стоимости нефти (из-за фундаментальной динамики спроса и предложения), тем самым снижая цены.
преимущество каузального анализа в том, что он может автоматически предсказывать такие отношения без «здравого смысла», просто основываясь на исторических данных. это особенно выгодно, когда мы имеем дело с большой многомерной системой и отсутствует полное предварительное знание о системе.
обзор библиотеки salesforce causalai
библиотека salesforce causalai направлена на решение проблем причинного обнаружения и причинного вывода, как описано выше. ниже мы описываем api-конвейер библиотеки, ключевые функции, поддерживаемые алгоритмы и сравнение этой библиотеки с существующими библиотеками.
Api-трубопровод
на рисунке выше показан конвейер библиотеки causalai. мы поддерживаем причинное обнаружение и причинный вывод. модуль причинного обнаружения принимает в качестве входных данных объект данных (содержащий данные наблюдений) и объект априорных знаний (содержащий любые экспертные частичные априорные знания, которые являются необязательными), и выводит причинный граф. модуль причинного вывода принимает в качестве входных данных причинный граф (который может быть напрямую предоставлен пользователем или оценен с помощью модуля причинного обнаружения) вместе с указанными пользователем вмешательствами и выводит предполагаемый эффект на указанную целевую переменную.
основные характеристики
некоторые из ключевых особенностей нашей библиотеки:
данные : причинно-следственный анализ табличных и временных рядов Магазин данных как дискретного, так и непрерывного типа.
пропущенные значения : поддержка обработки пропущенных/nan значений в данных.
генератор данных : синтетический генератор данных, который использует указанную модель структурного уравнения (sem) для генерации табличных и временных рядов данных. это может использоваться для оценки и сравнения различных алгоритмов обнаружения причин, поскольку известны основные истинные значения.