Конец ABBYY — это конец большой мечты. Мечты, которая родилась много десятилетий назад, задолго до самой компании. Мечты о том, что лингвистическая теория — то есть все те способы моделировать язык, которые придумали ученые-лингвисты, — поможет сделать наиболее точные инструменты автоматической обработки языка. Ведь это логично: чтобы создать атомную бомбу, надо понять устройство атома и атомного ядра. А чтобы создать машинный переводчик или систему автоматического извлечения информации из текста — надо понять устройство языка. Так?
На самом деле нет. По крайней мере всё, что мы знаем на сегодняшний день, указывает на обратное. Чем более успешными становились прикладные системы работы с естественным языком (информационный поиск в интернете, машинный перевод, распознавание речи, чатботы-ассистенты), тем меньше в них оставалось какой бы то ни было лингвистики. Этот тренд был замечен еще в конце 80-х — начале 90-х, когда в Америке стала популярной фраза, приписываемая Фредерику Елинеку, руководителю разработок по распознаванию речи в IBM:
«Каждый раз, когда мы увольняем лингвиста, качество работы системы повышается»
Фредерик Елинек
История компании ABBYY — это история трех десятилетий попыток опровергнуть этот обидный для лингвистов афоризм. Попыток, которые стоили десятки миллионов долларов, но так и закончились ничем.
понедельник, 4 ноября 2024 г.
как лингвисты проиграли последнюю битву за NLP
Теория, эксперимент и фальсифицируемость
четверг, 17 октября 2024 г.
Ловушка самоочевидных целей
Любое управление -- это многопараметрическая оптимизация. В переводе на русский она обычно обозначается как многокритериальная оптимизация, но параметры мне нравятся больше чем критерии.
Грубо говоря, многопараметрическая оптимизация представляет из себя задачу балансировки взаимоисключающих целей. Достижение одних, мешает или полностью исключает достижение других.
И хороших решений нет, потому что препятствием является не сложность поиска идеального ответа, а сама структура системы, исключающая его существование.
На это накладывается тот факт, что любая реальная система не может быть сведена к линейным задачам, как это любят представлять в теории автоматизации принятия решений, которую менеджеры пытаются применять вместо мозгов.
Практически всегда мы имеем дело со сложной несбалансированной системой с внутренними нелинейными связями и напряжениями, часть из которых известна, часть понята неправильно, а часть или непонятна, или банально не фиксируется имеющимися системами наблюдения.
То есть, цели не только противоречат друг другу, но ещё и обманчивы. Пойдя в одном направлении, можно уйти совершенно в другую сторону и, даже, оказаться в итоге значительно дальше от желанной цели.
А напряжения приводят к тому, что нелинейная модель ещё и не описывается гладкими функциями. То есть, при изменении параметров система может внезапно ускорить движение в неожиданном направлении или, вообще, структурно сломаться.
понедельник, 30 сентября 2024 г.
воскресенье, 7 июля 2024 г.
Пять разновидностей истории
воскресенье, 23 июля 2023 г.
UA Пауза (k) 2:03:37 / 3:22:01 Заменит ли Искусственный Интеллект Человека? / Технологическая Сингулярность
вторник, 11 июля 2023 г.
«всем известно» или «да это же элементарно и всё знают»
понедельник, 17 апреля 2023 г.
Not a hill to die on
(c) Камиль Галеев
среда, 23 марта 2022 г.
Российское общество не готово к всеобщей мобилизации
Научный сотрудник Политехнического университета Вирджинии (США), кандидат политических наук Мария Снеговая рассказала UKRLIFE.TV о военных настроениях в российском обществе. Интервью провела Людмила Немиря. Читайте канал Марии Снеговой в Telegram: https://t.me/mariasnegovaya
вторник, 15 марта 2022 г.
Виновата ли «русская культура»?
среда, 5 января 2022 г.
Интеллект — это способность видеть паттерны, cознание, cвобода воли
Интеллект — это способность видеть паттерны, cознание, cвобода воли
Сегодня хочу поделиться саммари одного из самых интересных подкастов
за всю историю подкастов. Йоша Бах (когнитивист, исследователь) + Лекс
Фиридман. 2 части (в сумме более 6 часов).
Я, наверное, раз 5 пересушивал первую часть и каждый раз находил в ней
инсайты, новые грани и оттенки смысла. Вторую часть я пока прошел
наполовину и она не уступает первой. Йоша умеет максимально емко и точно
использовать слова и метафоры для описания крайне сложных и
контр-интуитивных концепций.
🔗 Интеллект
Интеллект — это способность видеть паттерны.
Чем сложнее паттерны мы можем видеть, тем “выше” у нас интеллект.
Чтобы видеть паттерны, нужно уметь строить модели мира.
Мы строим модели нашего дома, поведенческие модели людей вокруг, модели
биологических и экономических взаимодействий. В конечном итоге: всей
вселенной.
В отличие от других живых существ, модель мира человека включает его
самого. В моей модели мира присутствую Я как субъект, все остальные
модели выстраиваются относительно этого Я. Когда AI научится делать так
же, возможно он обретет некую форму сознания. Но это не точно…
вторник, 26 октября 2021 г.
Человек не может думать постоянно
До некоторого времени считалось, что люди в большинстве своем мыслят рационально, здраво. А уж если мы здраво не мыслим – значит виной тому эмоции, и только они мешают жить и мыслить рационально. Однако мы даже не предполагаем, что наш мозг просто изначально запрограммирован на совершение ошибок и принятие неправильных решений.
Спасибо Канеману и его книге «Думай медленно, решай быстро», теперь мы знаем, что мозг наш работает в формате двух систем – системы медленного и быстрого мышления. Он устроен так, чтобы максимально сохранять энергию и при этом получать по максимуму пользы. Когда мы мечтаем, как бы так сделать, чтобы работать поменьше, а получать при этом побольше – это не мы такие плохие, ужасные и меркантильные, это ровно то, что наш организм от нас требует. Мы так устроены. Так что все ОК: мы работаем в режиме энергосбережения.
Наш мозг хранит практически всю когда-либо увиденную и услышанную
информацию – каждый листочек каждого дерева, каждый звук в толпе, каждое
ощущение – все попадает в некую систему хранения. Конечно, мозг делает
все, чтобы мы не сошли с ума, поэтому дает нам возможность забывать всю
эту информацию – но при этом хранить ее он не перестает. Никогда. Мы не
можем отключить или стереть что-то из памяти по собственному желанию.
Каждый раз, когда от нас требуется принять какое-то решение, мы
автоматически используем систему быстрого мышления – даже не задумываясь
об этом, оно вообще «как-то само».