Новая нефть: кто сможет выжить в эру искусственного интеллекта. Данные это новая нефть


Данные – это новая нефть

Центральным событием форума стало пленарное заседание «Цифровая экономика. Общество. Бизнес. Государство». Открыл его Председатель правительства Р Ф Дмитрий Медведев. По словам премьер-министра, цифровая экономика уже окружает нас. При этом, цифровизация меняет как образ жизни людей, так и принципы работы традиционных отраслей экономики. —Некоторые говорят, что данные — это новая нефть. Тот, кто научится превращать информационные массивы в полезные решения, тот выиграет, — подчеркнул Дмитрий Медведев. — И наоборот, тот, кто упустит эти возможности, останется на месте, может быть, даже навсегда. Это верно и по отношению к отдельным компаниям, отраслям экономики, и к целым государствам.

Вот почему так важно быть готовым — и на уровне бизнеса, и на уровне государства — к подобной цифровой трансформации. Ну, а потенциал у России есть. Среди других участников дискуссии были премьер-министр Люксембурга Ксавье Беттель, футуролог Митио Каку, основатель Alibaba Group, миллиардер Джек Ма, глава Сбербанка Герман Греф. Футуролог Митио Каку предрек наступление эры тотальной чипизации, что кардинальным образом отразится на подавляющем большинстве сфер нашей жизни, включая образование, здравоохранение, рынок труда. Роботы смогут частично заменить врачей и юристов, а развитие беспилотных технологий сократит количество водителей. Митио Каку обрисовал и другие перспективы, пока что больше напоминающие сюжеты из фантастических фильмов. Он уверен, что в недалеком будущем люди смогут загружать в мозг воспоминания и стирать их оттуда. Это вызвало улыбку у многих в зале, но вспомним, что когда-то чудаками слыли те, кто говорил о «железных птицах», летающих по воздуху. А потом появились самолеты.

Основатель и председатель совета директоров компании Alibaba Group Джек Ма призвал собравшихся не слишком волноваться в связи с грядущей робототизацией и больше доверять цифровым технологиям. В конце концов, подобный опыт у человечества уже есть. Так, во времена промышленной революции машины лишили многих людей работы. Но со временем появились новые возможности и рабочие места, только не в производственном секторе, а в сфере услуг. На вызовы цифровой реальности мы должны отвечать сообща.

«Открытые инновации» — это не только семинары, мастер-классы, заседания, но и знакомство с новейшими разработками ученых. Посетители выставки iMarket познакомились с лучшими проектами конкурса инновационных технологий, в числе которых, например, автономные дроны, способные доставлять посылки весом до одного килограмма. Большой резонанс вызвали презентации на iMarket первого в мире компьютера для незрячих ElBraille и медицинского экзоскелета, позволяющего быстрее восстанавливаться пациентам после инсульта или травмы. Настоящий фурор на форуме произвела робот София. Робот-гуманоид — разработка компании SingularityNET. Она умеет говорить по-английски и по-русски (специально «готовилась» к форуму), распознавать и выражать эмоции, видеть, двигаться и даже, если верить разработчикам, думать самостоятельно. Ее синтетическая кожа напоминает человеческую — и внешне, и тактильно. 18 октября робот-гуманоид выступила на пресс-конференции. «Технологии помогут сделать мир лучше. Вместе мы сможем решить многие проблемы», — заверила София собравшихся ее послушать.

Один из важных итогов форума — подписание соглашения между ПАО «Ростелеком», Nokia и Фондом «Сколково» о создании опытной зоны сети 5G на территории инновационного центра «Сколково». Сети 5G позволяют обмениваться информацией в 30 раз быстрее, чем поколение 4G. Иными словами, 10 гигабайт видео в формате HD можно будет загрузить в интернет почти мгновенно. 16 октября, открывая форум, зампред Правительства Р Ф Аркадий Дворкович сделал акцент на том, что «Открытые инновации» предоставляют возможность участникам форума найти необходимые контакты и инвестиции. И действительно, для многих эта возможность трансформировалась в новые перспективные знакомства и реальные контракты. В течение трех дней было проведено 911 деловых встреч, подписано 42 соглашения. Кстати, по словам организаторов, в этом году форум побил все прежние рекорды. В «Открытых инновациях-2017» приняли участие более 18 000 человек из 98 стран мира (для сравнения, год назад на форум приехали 12 000 человек). За форумом «Открытые инновации» закрепилась роль трендмейкера в сфере технологий будущего. Заместитель Генерального секретаря Международного Бюро Выставок Димитрий Керкентзес, присутствующий на формуме, рассказал, что проведение таких важных международных мероприятий увеличивает шансы России на проведение ЭКСПО 2025: «здесь, в „Сколково“, мы видим, что вы настроены серьезно и осознаете важность проведения выставки в Екатеринбурге.»

expo2025.tilda.ws

Искусственный интеллект: почему данные - это не новая нефть

Neil Ward-Dutton, MWD Advisors – директор службы исследований

У кого больше возможностей заработать на искусственном интеллекте и в чем они заключаются? Если пойти за деньгами, то куда они приведут?

Пару недель назад я написал в Twitter:

Размышляю про экономику ИИ в бизнесе. Есть подозрение: у средних и малых организаций возможностей намного меньше, чем у больших, при существующей технологии. Я еще немного поразмышлял над этим.

Для начала, давайте проясним один момент. Я собираюсь использовать неоднозначный термин «ИИ», несмотря на то, что многих он раздражает. В данном случае я имею ввиду применение технологий машинного обучения (machine learning) и глубокого обучения (deep learning) для обнаружения закономерностей в данных, выделения категорий, оценок и прогнозирования.

Применение ИИ “из коробки”

Проблема в том, что не все ИИ-приложения одинаковы. Действительно, когда мы говорим об ИИ, мы имеем в виду специализированный искусственный интеллект: системы, созданные и обученные работать с определенными задачами.

Далее, возможности ИИ сильно варьируются от одной области к другой.

По сути, для некоторых областей применения подойдут универсальные обученные модели и алгоритмы, тогда как во многих других областях пользу принесут только специальным образом разработанные решения. Другими словами, для некоторых применений существует возможность обучить универсальную систему на базе широкого набора данных, что позволит ей хорошо работать с точки зрения разных пользователей. Но для многих приложений это очень далеко от реальности.

Хорошим примером универсально обучаемого применения является распознавание лиц: систему можно обучить на большой библиотеке изображений лиц, и после этого для распознавания вашего лица ей понадобится относительно небольшое дополнительное обучение. Данные для обучения получить легко: существуют десятки баз для обучения распознаванию лиц, которые доступны он-лайн бесплатно. (Если вы хотите узнать больше о распознавании лиц в общем, вам стоит ознакомиться с этим замечательным материалом).

Вы увидите, что для таких приложений создание коммерческого продукта достаточно очевидно: вы предоставляете решение, которое встраивается «как есть» в большую платформу, и готово.

То же можно в большей или меньшей степени сказать о применениях ИИ в области коммуникаций – распознавание речи, синтез речи, понимание естественного языка и тому подобное. Посмотрите на эту схему. Здесь я попытался показать, что разные ИИ-приложения требуют разных моделей внедрения. Слева располагаются приложения более или менее универсальные; справа – те, которые должны быть намного более специализированным, чтобы приносить пользу.

график

Больше данных = лучше «упаковывается»

Для всех этих универсальных применений ключевым фактором является доступ к большим объемам данных для обучения.

А это в совокупности с возможностью широкого применения объясняет, почему операторы онлайновых платформ, ориентированных на конечных потребителей (Amazon, Google, Microsoft), с большой вероятностью и в ближайшем будущем будут снижать цену за эти услуги до нуля (уже можно увидеть, что Amazon делает с ценами на услуги ИИ, впервые анонсированные в 2016 году). Если вы продаете услуги универсального приложения ИИ как составляющую большого портфеля сервисов на базе прикладной платформы, то при очень высоких объемах цены естественным образом будут следовать за ценами комплекта.

Это также означает, что очень скоро ни IBM, ни кто-то другой из крупных поставщиков корпоративных систем (SAP, Oracle, Salesforce и т.д.) не смогут зарабатывать серьезные деньги на услугах из левой части графика.

Реальные деньги будут приходить из специализированных областей

Есть совершенно другие применения ИИ.

По мере того, как мы сдвигаемся вниз по графику от верхней точки слева, мы подходим к менее универсальным возможностям, которые можно применять во многих сценариях, но далеко не повсеместно. То, что имеет смысл для одного страховщика, желающего отсеять мошенников, можно частично распространить и на другого. Однако маловероятно, что можно полностью перенести и технологическое решение.

Один из способов «максимально упаковать» эти применения ИИ это их интеграция поставщиками в рамках облачных сервисов, которые сами по себе уже «упакованы» в какой-то мере (например, Einstein от компании Salesforce). В этом варианте, системы могут обучаться на (анонимных или мета-) данных, собираемых от широкого круга пользователей везде, где установлена система… так что даже если у одного пользователя недостаточно данных для обучения системы, данные, собираемые платформой в целом, дают необходимый объем.

Чем дальше мы перемещаемся по графику, тем в большей степени применения ИИ оказываются полезными только когда компоненты системы собираются под потребности пользователя, конфигурируются и обучаются в определенном окружении.

Для любого поставщика, который хочет играть на этом рынке, сложность состоит в том, как соединить в единое целое фреймворки, знания и консультирующий персонал, чтобы минимизировать объем работы (и время) на доработку под конкретного пользователя, необходимую чтобы решение представляло ценность для потребителя. В сегодняшнем мире с облачными технологиями в приоритете, мало организаций готовы ждать 9-12 месяцев или даже больше, чтобы получить то, что не гарантирует преимущество. Вы можете посмотреть здесь о том вызове, который стоит перед IBM по мнению Craig Wentworth.

И все-таки, хвост – это хвост…

Последняя мысль, которую я хочу высказать, касается размера рынка для этих специализированных применений ИИ.

Нам никуда не деться от того факта, что, независимо от того, насколько универсальным является данное применение, чтобы сделать его действительно необходим доступ к значительному объему данных для обучения.

Малые и средние предприятия могут получить пользу от ИИ в верхней части кривой: там, где приложения можно упаковать и предложить широкой аудитории. А благодаря облачным сервисам, у них есть шанс получить пользу и от средней части графика. Но извлечь пользу из применений, находящихся на «хвосте специализации», малым и средним предприятиям гораздо сложнее (особенно если эти применения нацелены на улучшение операций, используя данные от этих операций), потому что практически нет возможности получить достаточно данных.

Крупный банк будет взаимодействовать с десятками тысяч клиентов каждый месяц, и данные этого взаимодействия могут стать данными для обучения. Специализированная инженерная фирма работает максимум с десятком клиентов за месяц, это не даст достаточно топлива для ИИ.

Данные – это НЕ новая нефть

Я сбился со счета, сколько раз я видел презентации, где провозглашалось, что «данные – это новая нефть».

Да, на очень высоком уровне абстракции, обобщенные “данные” во все возрастающей степени становятся источником роста бизнеса и его конкурентного преимущества… Но когда дело доходит до конкретики и когда мы удаляемся от применений на универсальной верхней части кривой, эта аналогия начинает хромать.

Оригинал статьи

www.comindware.com

Греф: России требуется новая система управления

Герман ГрефПравообладатель иллюстрации RIA Novosti Image caption Герман Греф призывает не опоздать на поезд agile, но предупреждает, что это будет непросто

Мало кто заметил, но в 2015 году закончился век IT (информационных технологий) - и начался век цифровизации. В этой новой реальности Россия может легко затеряться, если не выйдет на качественно новый уровень управления, считает глава "Сбербанка" Герман Греф.

Об этом он рассказал выпускникам московской бизнес-школы "Сколково" в субботу.

Глава крупнейшего российского банка заочно поспорил с авторами экономического бестселлера Why Nations Fail ("Почему одни страны богатые, а другие бедные" в русской версии), считающими главной причиной несостоятельности тех ли иных народов качество институтов (суды, всеобщие выборы, частная собственность и т.д.).

"Корневое звено", по выражению Грефа, нужно искать не в институтах, а в плоскости управленческих практик, для которых в России свойствен чрезмерный бюрократизм. Он призвал всех присутствующих и отсутствующих переходить на новые практики управления, такие как agile (о которой далее в статье).

В чем залог конкурентоспособности компаний и государства? Почему компания потокового видео Netflix оценивается почти во столько же, во сколько гигантский "Сбербанк"? Почему одна новая технология способна похоронить всю банковскую систему - и почему лично Германа Грефа это нисколько не пугает?

Русская служба Би-би-си приводит выжимку из лекции, прочитанной банкиром в "Сколково". Цитаты сокращены и, где требовалось, литературно отредактированы.

Секрет конкурентоспособности

Залог конкурентоспособности - не производство одного гениального продукта, а способность с завидной регулярностью поставлять эти продукты на рынокГерман Греф

"Сегодня самая главная идея, которая позволяет нам адаптировать темпы текущего времени, - создание таких моделей управления, которые позволили бы нам остаться на плаву.

В ходе посещения Силиконовой долины мы были в офисе Uber, где один из основателей компании Трэвис Каланик сказал мне: "Знаешь, китайцы - хорошие ребята, и, похоже, они не просто научились воровать наши идеи, они научились их имплементировать. Если мы утром что-то придумали, то в обед это уже реализовали китайцы".

Это, конечно, небольшое преувеличение, но только небольшое. Потому что залог конкурентоспособности сегодня - не производство одной гениальной идеи или продукта, а способность с завидной регулярностью поставлять эти продукты на рынок".

Почему одни страны богатые, а другие бедные

"На мой взгляд, авторы книги Why Nations Fail, рассматривают следствия, а не причины. Экстрактивность и инклюзивность - важные вещи, но они не дают ответа на вопрос как. [Авторы Дарон Аджемоглу и Джеймс Робинсон вводят понятие "инклюзивных" политических и экономических институтов, в основе которых лежит включение граждан в общественные процессы на условиях извлечения выгоды, и "экстрактивных", представляющих собой противоположность первых - прим. Би-би-си]. В любом процессе есть всегда какое-то корневое звено, до которого ты должен докопаться, и там про это звено не сказано.

Есть два существенных фактора: политическая составляющая, которая требует отдельного рассмотрения, и управленческая составляющая. У нас сейчас имеются многие институты, но, к сожалению, многие из них или даже большинство носит имитационный характер. Начиная уже с института частной собственности: вроде бы он у нас есть, но в то же время попробуй его защити в другом институте под названием "судебная система".

У нас сейчас имеются многие институты, но, к сожалению, многие из них или даже большинство носит имитационный характерГерман Греф

Я считаю, что такое корневое звено - это система управления. Если оценивать наше государство с точки зрения бимодальной системы управления run & change [где run относится непосредственно к функционированию, а change отвечает за непрерывную модернизацию], то наше государство находится в плоскости run.

Если обычные утверждения о том, что наше государство коррупционное и бюрократическое, перевести на нормальный технократический язык, то что такое бюрократия? Она имеет два проявления: недорегулированность и перерегулированность. В конечном счете, все это сводится к плохому process management [управлению процессами]. Чтобы от этого уйти, нужны изменения, реформы. А что такое реформа?

Любая реформа - это проект. Где project management [управление проектами] в системе управления нашего государства? Оно практически отсутствует. Это касается не только России, это болезнь очень многих государств, почти всех. Но сейчас другие государства пытаются от этого уходить. В Великобритании, например, Тони Блэр в бытность премьер-министром создал так называемый delivery unit [правительственный центр при премьер-министре по контролю над оказанием госуслуг].

Сегодня это в разной форме практикуется в огромном количестве стран. В нашем государстве очень развита функция HR administration [администрирование кадров], но отсутствует в полном объеме то, что мы называем HR development [развитие кадров]. Нет ни одного органа в государстве, который занимался бы этим".

Подвижные системы управления

"Слово agile [буквально - гибкий, подвижный] становится популярным во всем мире и, слава богу, в нашей стране. Но мы приходим к нему, как и во многих других случаях, последними. Для agile-управления характерно слово "тупицца", с двумя "Ц": от английского two pizza. Это маленькие команды, которые условно можно накормить двумя пиццами. Все компетенции в этой команде соединены воедино.

На 30-50% уменьшается количество менеджеров, они просто не нужны. Всё выпускается в течение максимум двух недель, короткими спринтами. Все это автоматически загружается в вашу платформу, которая должна быть для этого адаптирована. Эта система хороша тем, что видно результаты работы каждой небольшой команды.

Если мы и дальше будем отставать, то это отставание будет, к сожалению, мало сопрягаться с нашей возможностью выжить в глобальном миреГерман Греф

Для legacy organizations [тут Герман Греф прибегает к лексикону программистов, которые называют термином legacy systems устаревшие программные системы, предшествующие современным - прим. Би-би-си] это громадный вызов. Надо переработать все процессы управления. А чем больше у тебя бизнес, тем больше у тебя процессов.

Плохая новость, которую я привез из Силиконовой долины в этом году, состоит в следующем. Мы уже выходили из Pivotal Software, и вдруг я вижу, что в одной из открытых переговорных сидят уважаемые люди - не в джинсах, как все мы там, а в костюмах. Я спрашиваю: "Что это за люди странные?" А мне отвечают: "Это сидит правительство Норвегии, они изучают agile".

И мне стало плохо. Выяснилось, что у них уже было правительство Новой Зеландии, два министерства США. Скорость преобразований в тех государствах, где внедряется agile, будет так нарастать в отношении нас, что это станет уже просто опасно для нашей страны. Если мы и дальше будем отставать, то это отставание будет, к сожалению, мало сопрягаться с нашей возможностью выжить в глобальном мире".

Две очень разные компании

"2015 год - год перелома, перехода из века IT в век цифровизации (DIGITIZATION, перевод информации в цифровую форму). Не все отчетливо понимают, в чем разница.

Разница в том, что мы все становимся data driven [в основе многих экономических и общественных процессов лежит работа с большими массивами цифровых данных]. Мы в этом году приехали в компанию Netflix в Силиконовой долине. Лучше бы мы туда не приезжали, потому что в этой компании я себя почувствовал мамонтом.

Если данные - это новая нефть, то компании Netflix - это нефтяная компания с глубиной переработки близкой к 100%Герман Греф

Если мы говорим о том, что данные - это новая нефть, то компания Netflix - это нефтяная компания с глубиной переработки близкой к 100%. Вроде бы никаких толковых данных компания не имеет, ведь мало же кто регистрируется под своим реальным именем.

Однако если я зарегистрируюсь там под вымышленной фамилией и зайду туда три-четыре раза, то у меня не останется ни одного шанса не быть расшифрованным компанией. Она анализирует такие метаданные, как стиль регистрации, время нахождения на ресурсе, время регистрации, подбор фильмов, последовательность подбора фильмов, минуты просмотра - и на этом основании вычисляет твой профиль. Это большая математика.

Компания стоит сегодня 40 млрд долларов - чуть поменьше, чем "Сбербанк". Но в "Сбербанке" работает 330 тысяч сотрудников, а там - 3 тысячи. Если наше будущее связано с тем, что из 330 тысяч человек останется 30 тысяч [имеется в виду сценарий, при котором в компании в результате внедрения новых технологий останется 30 тысяч высокопроизводительных рабочих мест, а остальные будут упразднены - прим. Би-би-си], то это хорошие новости. Тогда у нас есть шанс".

Технология, способная похоронить банки

"Все компании в мире делятся на две части: те, которых "хакнули" - и они об этом знают. И те, которых "хакнули", но они пока не в курсе. Я с этим полностью согласен. Сегодня самый большой драйвер наших расходов - это cyber security и compliance (кибербезопасность и соответствие государственным и корпоративным стандартам).

И то и другое не очень производительно, но крайне нужно. Если мы сегодня не будем инвестировать в cyber security, то завтра мы будем инвестировать в правоохранительные органы, которые будут безуспешно искать деньги наши клиентов.

Сегодня 200 млн хакеров в мире работают против компаний. Есть четыре наиболее атакуемые страны: Россия, Бразилия, США и Германия. Если вторые две сильно защищены, то первые две являются лакомой добычей.

Я не знаю людей, которые сильно любят банки, я и сам не люблю ихГерман Греф

Технология blockchain [подробнее об этом - в специальном сюжете Би-би-си о биткойнах и других криптовалютах], на мой взгляд, - это новый интернет. Это идея такого же уровня, как интернет. И она не успела еще родиться, как наш центробанк сказал, что криптовалюты нельзя выпускать. Потом они сказали, что их нельзя еще покупать, а теперь они говорят, что тех, кто попытается их купить, могут посадить в тюрьму. Мы понимаем, что весь прогресс в этом случае уйдет за пределы России, все наши специалисты в области blockchain будут вынуждены работать в более удобных юрисдикциях.

Перспектива такова, что я пока не вижу в мире, где есть blockchain, места банкам. В принципе, все функции, включая CEO, постепенно заменяемы алгоритмами. Конечно, там есть некоторое количество нерешенных проблем, но они решаемы со временем.

Я себя готовлю к такому будущему. Впрочем, я не уверен, что на похороны банковской системы придет большое количество людей. Я не знаю людей, которые сильно любят банки, я и сам не люблю их".

Эпилог (в виде привета Столыпинскому клубу)

"Мы во всей нашей истории с завидным упорством повторяем одни и те же ошибки. Сейчас опять мы слышим: давайте попробуем запустить денежную эмиссию, которая почему-то у нас не должна вызвать инфляцию.

Давайте огосударствим экономику, потому что частный бизнес якобы не работает в нашей стране. Все это уже много раз было и уже не раз привело к известному печальному результату. Нам надо извлекать уроки из собственной истории".

www.bbc.com

Новая нефть: кто сможет выжить в эру искусственного интеллекта

|1 февраля 2018|Аджай АгравалДжошуа ГансАви Голдфарб

Искусственный интеллект наступает. Об этом мы слышали весь 2017 год и, по-видимому, будем слышать и в этом. Известные компании, если только это не Google или Facebook, не могут не задаваться вопросом: «Что поможет нам выжить в новых условиях?»

По нашему опыту, когда бизнес-лидеры задают этот вопрос об ИИ, ответом становится слово «данные». Это мнение подтверждается деловой прессой. Сотни статей утверждают, что «данные — это новая нефть», имея в виду, что данные становятся горючим, обеспечивающим рост экономики искусственного интеллекта.

Если это ваш случай, то вашей компании повезло. Вы собрали эти данные, и теперь, оказывается, сидите на запасах нефти в ожидании пришествия ИИ. А пока хорошо бы спросить себя: «Действительно ли нам так повезло?»

В словах «данные — это нефть» есть доля правды. Аналогично тому, как двигатели внутреннего сгорания нуждаются в топливе, искусственный интеллект нуждается в данных. ИИ берет необработанные данные и превращает их во что-то полезное для принятия решений. Хотите узнать погоду на завтра? Используйте прошлые данные о погоде. Хотите узнать, как будут продаваться йогурты на следующей неделе? Используйте данные о прошлых продажах. Искусственный интеллект строит прогнозы на данных.

Но нужны ли искусственному интеллекту именно ваши данные? На сегодня существует тенденция рассматривать все данные как потенциально ценные для искусственного интеллекта, но это не совсем так. Да, данные аналогично топливу используются для построения прогнозов. Но данные, на которых вы сидите, скорее всего, не те. Данные, которыми вы обладаете и которые ваша компания накопила со временем, относятся к типу, используемому для создания механизмов прогнозирования, но не для их эксплуатации.

Имеющиеся у вас данные – это обучающие данные. Они используются для обучения алгоритма. И вы пользуетесь этим алгоритмом для получения прогнозов, которые влияют на ваши действия.

В этом смысле ваши данные представляют ценность. Но это не означает, что ваш бизнес переживет шторм. Стоит вам использовать данные для обучения механизма прогнозирования, как они обесцениваются. Они больше непригодны для подобных прогнозов. Количество прогнозов, для которых можно использовать данные, ограничено. Если продолжить аналогию с нефтью, данные горят. После использования они превращаются в пустышку. Ученым это известно. Они тратят годы на сбор данных, но после того, как их использовали для получения результатов исследования, эти данные пылятся в ящике или хранятся на резервном диске. Возможно, ваш бизнес и сидит на нефтяной скважине, но ее нельзя считать бесконечной. Она гарантирует ваше будущее в экономике искусственного интеллекта меньше, чем ликвидационная стоимость.

Даже если ваши данные представляют ценность, у вас может быть ограничена возможность завладеть этой ценностью. Сколько еще существует сопоставимых источников данных? Если вы один из множества продавцов йогуртов, то ваша база данных, содержащая информацию за последние 10 лет о их продажах и связанные данные (цена, температура, продажи аналогичных продуктов вроде мороженого) будет иметь меньшую ценность, чем если бы вы были единственным обладателем подобных данных. Иначе говоря, как и в случае с нефтью, чем больше других поставщиков данных того же типа, тем меньшую ценность вы можете из них извлечь. Кроме того, на ценность ваших обучающих данных влияет ценность, получаемая с помощью повышенной точности прогнозов. Ценность обучающих данных выше, если повышенная точность прогноза может увеличить продажи йогуртов на $100 млн, а не на $10 млн.

Кроме того, источником постоянной ценности являются повседневные действия, то есть данные, накапливаемые ежедневно. Новые данные позволяют вам эксплуатировать механизм прогнозирования после его обучения. Они также дают возможность улучшать его путем обучения. Данные о продажах йогурта за 10 лет ценны для обучения модели ИИ прогнозировать будущие продажи, однако актуальные прогнозы, используемые для управления цепочкой поставок, требуют непрерывных операционных данных. И это важный момент для компаний, давно работающих на рынке.

Стартап, пользующийся искусственным интеллектом и приобретающий ценные данные о прошлых продажах йогуртов, может обучить модель ИИ прогнозировать будущие продажи. Но он не может использовать ее для принятия решений, если не будет постоянно получать операционные данные для обучения. В отличие от стартапов крупные предприятия генерируют операционные данные ежедневно. И в этом их преимущество. Чем больше операций, тем больше данных. Кроме того, владелец компании может пользоваться прогнозом для улучшения будущих операций.

В условиях экономики искусственного интеллекта ценность накопленных вами данных ограничена разовым преимуществом обучения используемого вами ИИ. На ценность обучающих данных, как и на ценность нефти или другого сырья, влияет общий объем предложения: чем больше компаний располагают ими, тем ниже ценность. В отличие от них ценность регулярно получаемых операционных данных не ограничена одноразовым применением, а обеспечивает постоянное преимущество и улучшает механизм прогнозирования. То есть несмотря на все разговоры о том, что данные — это новая нефть, суть не в накопленных исторических данных. Хотя благодаря им вы можете добраться до сути, их ценность для будущего вашего бизнеса невелика. Но если вы сможете найти способы генерировать непрерывный поток новых данных, вы сможете обеспечить улучшение способности прогнозирования ИИ. И будете иметь устойчивое преимущество, когда эра искусственного интеллекта настанет.

Об авторах. Аджай Агравал — профессор предпринимательства Школы менеджмента им. Ротмана при Университете Торонто и научный сотрудник Национального бюро экономических исследований в Кембридже, штат Массачусетс. Основатель лаборатории Creative Destruction Lab и один из основателей The Next AI и Kindred, соавтор книги «Prediction Machines: The Simple Economics of Artificial Intelligence». Джошуа Ганс — профессор стратегического менеджмента Школы менеджмента им. Ротмана, соавтор книги «Prediction Machines: The Simple Economics of Artificial Intelligence» и автор книги «The Disruption Dilemma», выпущенной издательством MIT Press. Ави Голдфарб — профессор маркетинга Школы менеджмента им. Ротмана при Университете Торонто, научный сотрудник Национального бюро экономических исследований, главный специалист по данным в Creative Destruction Lab и старший редактор «Marketing Science», соавтор книги «Prediction Machines: The Simple Economics of Artificial Intelligence».

hbr-russia.ru

«Данные — это новая нефть»

Авторство цитаты приписывается британскому математику Клайву Хамби, разработавшему систему лояльности для торговой сети Tesco. Он произнес ее на конференции по маркетингу в 2006 году. Постепенно смысл этих слов доходит до широкой аудитории. И хотя люди продолжают воевать за нефть, контуры будущих конфликтов за данные проступают уже сейчас.

До недавних пор компании управляли традиционными активами — имуществом, деньгами, интеллектуальной собственностью. Цифровая эпоха принесла новый тип активов — данные. Это сырье, из которого производятся прогнозы, инсайты и очень большие деньги. Как пишет Economist, в XXI веке данные сыграют ту же роль, что нефть в XX-м. То есть станут главным фактором роста и перемен. Онлайн-сервисы работают на данных, как машины на бензине.Каждый наш шаг оставляет цифровой след: когда мы гуглим значение нового мема, покупаем кофе в Старбаксе, слушаем музыку в Apple Music, лайкаем фотку соседского кота, кликаем виральный заголовок, смотрим новую серию «Игры престолов». И чем больше у нас гаджетов, тем больше данных о нас собирают. Компании пытаются узнать нас поближе, чтобы продать нам больше товаров и услуг. Иногда они знают о нас больше, чем мы знаем о себе.Объем накопленных миром данных в зеттабайтахИсследование IDC, апрель 2017Благодаря интернету вещей источниками данных стали любые устройства — от тостера до авиационного двигателя. Цифровой слепок человека все точнее. Все, что мы делаем, генерирует данные, а данные генерируют кэш. По прогнозу IDC, в 2017 году мировой рынок больших данных заработает $150,8 млрд, в 2020 году — $203 млрд.Исследование «Corporate Surveillance in Everyday Life», июнь 2017Data-driven сделкиВ экономике данных уже так не важно, окупается ли ИТ-проект. Когда есть большая аудитория и налажен сбор данных, монетизация — дело наживное. В этом свете 68-миллиардная оценка убыточного Uber, который многие считают пузырем, уже не кажется полным абсурдом. Самый дорогой стартап мира владеет крупнейшим массивом данных о рынке персональных перевозок (более 5 млрд поездок). Равно как и Tesla — не просто модный электрокар, а база данных о вождении на совокупной дистанции более 2 млрд км. Она дает компании фору в создании технологии беспилотного вождения. У разработчика беспилотных авто Waymo (принадлежит Alphabet) пока на порядок меньше данных.

Самым ценным активом обанкротившейся гемблинговой компании Caesars Entertainment оказались данные о 45 миллионах участников программы лояльности. Их оценили в $1 млрд.

Корпорации могут позволить себе купить компании, которые владеют нужной им базой пользователей. Этим объясняются многие крупнейшие сделки последних лет. Facebook купил Instagram и WhatsApp, Microsoft купил LinkedIn и т.д. Это вызывает беспокойство антимонопольных властей. В процессе согласования сделки по поглощению WhatsApp Facebook обещал не объединять данные двух компаний, но в прошлом году таки начал это делать. За это Еврокомиссия оштрафовала соцсеть на $122 млн.

Экономика данных требует от регуляторов новых подходов. Им придется быть не менее изобретательными, чем те, кого они регулируют. Чтобы не допустить диктата монополий, власти обязывают крупняк делиться данными с новыми проектами. Например, в Германии страховщики должны делиться с маленькими фирмами статистикой о страховых случаях. В следующем году вступят в силу европейские нормативы о защите данных. Интернет-сервисы будут обязаны получать от пользователей явное согласие на то, как будут использоваться их данные, а также позволить им экспортировать свои данные для передачи другим компаниям.

Чтобы конкурировать с гигантами, более мелкие игроки могут собираться в data-кооперативы. Так, крупнейшие немецкие медиа объединили большие данные с тысячи своих сайтов на общей платформе Emetriq, чтобы снизить свою зависимость от Google и Facebook, контролирующих 85% мирового рекламного рынка.

Легально торговать данными гораздо труднее, чем нефтью. Каждый датасет уникален, такой актив сложно оценить. Правовой базы еще нет, каждый контракт сочиняется с нуля и содержит десятки страниц о том, как покупатель будет использовать и защищать данные. Oracle разрабатывает единую инфраструктуру для обмена данными, которая позволит ее клиентам покупать и продавать свои базы данных в безопасной облачной среде.

Есть интересные примеры бартера: Национальная служба здравоохранения Великобритании предоставила DeepMind (ИИ-подразделение Alphabet) доступ обезличенным данным 1,6 млн пациентов, чтобы умные алгоритмы помогали врачам лечить пациентов с почечной недостаточностью.Верните нам наши данныеЧто все это значит для пользователей? Data-driven подход приводит к тому, что ИТ-продукты становятся все удобнее, а контент — все интереснее. Люди слишком привыкли к бесплатным онлайн-сервисам и не отдают себе отчета в том, за чей счет банкет. Так родился еще один расхожий афоризм: «Если ты не платишь за товар, сам становишься товаром» (англ. if you're not paying for the product, you are the product).

Британцы очень возмущались, когда производитель бесплатного антивируса AVG решил заработать на продаже их поисковых запросов. Некоторые даже объявили бойкот. Представители AVG тогда парировали, что они открыто внесли изменения в свою политику конфиденциальности, а другие делают то же самое без ведома пользователей. Но даже платные сервисы собирают данные, чтобы потом использовать их для создания смежных продуктов.

Впереди нас ждет много битв за то, кто должен владеть данными и кто может на них зарабатывать. Де факто данными владеют и распоряжаются платформы, которые их собирают, а де юре — еще предстоит выяснить. Данные можно скопировать и продать много раз. Это несет угрозу утечек и нецелевого использования, которое может причинить вред пользователю.

Потенциал конфликта в том, что люди не понимают, какие данные о них собираются и как они будут использоваться. Они подписываются под нечитанными пользовательскими соглашениями, которые составлены в интересах бизнеса и разрешают передачу данных третьей стороне. В перспективе наши данные могут свидетельствовать против нас. Например, сначала человек покупает симку, а потом ему не одобряют кредит.

Но велики ли наши шансы на информированное согласие? В прошлом году норвежские правозащитники прочитали правила пользования 33 самых популярных в стране приложений. Это заняло у них 30 часов. А недавно британский провайдер публичного Wi-Fi добавил в пользовательское соглашение право отправить юзера сети чистить общественные туалеты. За две недели эксперимента на такие условия подписались 22 тысячи человек.

Колумнист и писатель Евгений Морозов считает несправедливым, что на данных пользователей зарабатывают все, кроме них самих. Он призывает относиться к данным как к природным ресурсам, которые должны принадлежать народу, а не корпорациям. Тогда люди сами смогут создавать для себя полезные сервисы. «Верните нам наши данные. <...> Если всеми ресурсами завладеют Google и Facebook, они позволят нам дышать, только когда мы смотрим рекламу», — говорит он.

В западных медиа все чаще звучит мысль о том, что ИИ-сервисы — продукт не только разработчиков, но и тысяч пользователей, послушно заполняющих регистрационные формы. По мнению правозащитников, люди заслуживают более весомой компенсации, чем бесплатные сервисы. Но сколько стоят наши данные?

В 2013 году американский студент Федерико Занниер продал свои данные всем желающим на Kickstarter. В течение 50 дней он фиксировал все свои действия в интернете: посещенные сайты, скриншоты просмотренных страниц, переписку с друзьями, логи приложений, движения мыши, историю передвижений. Во время работы на компьютере каждые 30 секунд его фотографировала веб-камера.

Цифровой архив Федерико за день стоил $2, весь массив — $250. «Если бы больше людей сделали то же, что и я, рекламодатели платили бы за наши данные напрямую, — написал он на странице проекта. — Это кажется безумным, равно как и отдавать наши данные бесплатно».Через год эксперимент повторил голландец Шон Баклз. С помощью онлайн-аукциона он выручил за свои персональные данные 350 евро. «Обычно данные людей продаются по 50 центов, но я выложил самую интимную информацию о себе, — отметил он. — Не знаю, является ли эта сумма достаточной».

Датасет включал медицинские записи, переписку в электронной почте и соцсетях, историю перемещений, личный календарь, потребительские предпочтения, историю браузера и личные записи. Массив выкупило издание The Next Web, чтобы блеснуть этим прецедентом на конференции. Это соответствовало цели акции — привлечь внимание к этике данных. «Приватность — это право каждого быть незаметным и самостоятельно решать, какой информацией делиться и с кем», — писал Баклз. Вырученные деньги он пожертвовал голландской правозащитной организации Bits for Freedom.

Но на практике компании покупают аудиторные данные оптом, а не в розницу. Нужно быть очень успешным человеком, чтобы ваши данные стоили больше доллара. В 2013 году Financial Times опубликовала калькулятор для расчета стоимости персональных данных. Цены могли устареть, зато этот инструмент наглядно показывает, какие сведения делают вас наиболее привлекательным объектом для рекламодателей (беременность, владение яхтой, страсть к путешествиям и т.д.).Будем реалистами: большинство людей никогда не удалятся из соцсетей и не прекратят пользоваться условно бесплатными сервисами. Жесткие ограничения на использование данных запрут этот невероятно ценный актив в частных дата-центрах и убьют на корню сотни будущих интеллектуальных сервисов, которые действительно сделают мир лучше. Для компаний наши данные все равно не бесплатны. Чтобы хранить растущие цифровые богатства, им приходится покупать новые серверы и платить за электричество.

Европейцы предлагают создавать биржи персональных данных, которые позволят пользователям монетизировать свое цифровое ДНК. Такой подход вернет обывателям контроль над сбором и использованием сведений о них. На Западе возникла целая ниша стартапов, которые помогают людям распорядиться своими данными: CitizenMe, Datacoup, Mass Network, Hub of All Things, Cozy, Digi.me и другие. А тайваньский стартап Bitmark делает это с помощью блокчейна.Необходимость платить за аудиторные данные ударит по заработкам ИТ-компаний. С другой стороны, им может быть даже выгодна такая схема, ведь добровольно переданная информация гораздо точнее обрывочных сведений серого происхождения.

businessnauka.livejournal.com


Смотрите также