данных очень хорошо справлялись с применением бизнес-аналитики к структурированным данным (например, организованному контенту, такому как таблицы чисел). но для импорта данных из других систем записи им требовались трудоемкие инструменты извлечения, преобразования и загрузки (etl).
озера данных были созданы для сбора огромного (и постоянно растущего) количества неструктурированных данных (например, неорганизованных данных, таких как сообщения в социальных сетях, журналы датчиков и мобильные координаты), которые организации хотели бы использовать. но извлечение полезных сведений часто требует дорогостоящих ресурсов науки о данных и может представлять проблемы безопасности и соответствия требованиям.
что возвращает нас к главному вопросу: что такое хранилище данных? хранилище данных устраняет стены между озерами и хранилищами — объединяя недорогое, гибкое хранилище озера данных с управлением данными, схемой и руководством хранилища.
лучше всего то, что озера данных могут помочь вашему бизнесу Магазин снизить затраты, сократить невыполненные работы разработчиков и стать более эффективными — помогая вам делать больше с меньшими затратами. разделяя вычисления и хранение, они позволяют компаниям легко добавлять больше хранилища без необходимости наращивать вычислительную мощность.
это очень экономичный способ расширить аналитические усилия, поскольку расходы, связанные с хранением данных, остаются низкими.
а как насчет всех моих существующих инвестиций в решения по обработке данных?
ваши существующие решения могут оставаться на месте. нет необходимости «разрывать и заменять» при внедрении хранилища данных.