Post by jakiasultana963 on Nov 12, 2024 4:03:15 GMT
Мы слышим заявления вроде «Данные — это новая нефть», «Данные — это кровь любого бизнеса» почти десятилетие. «Большие данные» были модным словечком не так давно, за ним последовало «IoT», а теперь и ИИ/машинное обучение. Независимо от терминологии, факт в том, что данные являются основополагающим фактором, который продвигает эти новые технологии и их бизнес-приложения вперед.
По данным Всемирного экономического форума , еще в 2019 году они предсказывали, что к 2020 году объем всех данных вырастет до 44 ЗБ (1 зеттабайт (ЗБ) = 1 миллион петабайт). Быстрая оцифровка, удаленная работа, обучение и новые приложения, появившиеся во время пандемии, привели к резкому росту объема данных, который к концу 2022 года достигнет 94 ЗБ. Это более чем в два раза превышает рост данных только за последние 24 месяца.
ИИ и машинное обучение используют большие объемы данных для построения моделей и обучения их выдаче выводов, необходимых для получения значимых результатов. По мере того, как внедрение ИИ продолжает расти, потребность в большем количестве данных становится еще более острой.
Сопутствующий блог: 10 вещей, которые вам следует знать о квантовых вычислениях и искусственном интеллекте
Многогранность данных
Раньше было время, когда данные были почти всегда структурированы таблицы, столбцы, формы, транзакции и т. д.) и часто размещались в базах данных и хранилищах данных, разбросанных по различным функциям внутри организации или даже внутри одного из ее филиалов. Поскольку мир Данные телеграммы датчиков, изображений, видео, голоса, социальных сетей стремительно развивался в течение последних полутора десятилетий, неструктурированные данные (необработанные данные, полученные как есть без определенного формата) стали преобладать в млюбой бизнес. Теперь организациям приходится справляться с управлением несколькими типами данных и укрощением неструктурированных данных, которые крайне непредсказуемы. Кроме того, новые правила и законы о конфиденциальности (например, GDPR Европы, Закон о защите прав потребителей Калифорнии) еще больше ограничивают использование всех данных, которые собираются и хранятся в организации, не говоря уже о множественных копиях данных, используемых для различных бизнес-приложений.
Больше данных также приводит к стратегическим, управленческим и политическим проблемам относительно того, кто управляет, хранит, получает доступ и в конечном итоге владеет данными, и, что важно, для каких целей или анализов будут использоваться данные. Плохое управление данными также может препятствовать соблюдению нормативных требований, которые могли быть не предусмотрены, когда данные собирались изначально. Большинство средних и крупных организаций сегодня имеют управляющих данными, таких как CDO (главные специалисты по данным или цифровые директора), которые руководят и несут ответственность за управление данными организации — безусловно, это далеко от команды ИТ/CIO, которая владела всем этим в прошлом.
По данным Всемирного экономического форума , еще в 2019 году они предсказывали, что к 2020 году объем всех данных вырастет до 44 ЗБ (1 зеттабайт (ЗБ) = 1 миллион петабайт). Быстрая оцифровка, удаленная работа, обучение и новые приложения, появившиеся во время пандемии, привели к резкому росту объема данных, который к концу 2022 года достигнет 94 ЗБ. Это более чем в два раза превышает рост данных только за последние 24 месяца.
ИИ и машинное обучение используют большие объемы данных для построения моделей и обучения их выдаче выводов, необходимых для получения значимых результатов. По мере того, как внедрение ИИ продолжает расти, потребность в большем количестве данных становится еще более острой.
Сопутствующий блог: 10 вещей, которые вам следует знать о квантовых вычислениях и искусственном интеллекте
Многогранность данных
Раньше было время, когда данные были почти всегда структурированы таблицы, столбцы, формы, транзакции и т. д.) и часто размещались в базах данных и хранилищах данных, разбросанных по различным функциям внутри организации или даже внутри одного из ее филиалов. Поскольку мир Данные телеграммы датчиков, изображений, видео, голоса, социальных сетей стремительно развивался в течение последних полутора десятилетий, неструктурированные данные (необработанные данные, полученные как есть без определенного формата) стали преобладать в млюбой бизнес. Теперь организациям приходится справляться с управлением несколькими типами данных и укрощением неструктурированных данных, которые крайне непредсказуемы. Кроме того, новые правила и законы о конфиденциальности (например, GDPR Европы, Закон о защите прав потребителей Калифорнии) еще больше ограничивают использование всех данных, которые собираются и хранятся в организации, не говоря уже о множественных копиях данных, используемых для различных бизнес-приложений.
Больше данных также приводит к стратегическим, управленческим и политическим проблемам относительно того, кто управляет, хранит, получает доступ и в конечном итоге владеет данными, и, что важно, для каких целей или анализов будут использоваться данные. Плохое управление данными также может препятствовать соблюдению нормативных требований, которые могли быть не предусмотрены, когда данные собирались изначально. Большинство средних и крупных организаций сегодня имеют управляющих данными, таких как CDO (главные специалисты по данным или цифровые директора), которые руководят и несут ответственность за управление данными организации — безусловно, это далеко от команды ИТ/CIO, которая владела всем этим в прошлом.