Размер русскоязычного nlp сообщества


#1

Как вы думаете каков размер русскоязычного NLP сообщества? Сколько людей занимаются профессионально АОТ или компьютерной лингвистикой в индустрии или в академии? Много это или мало (есть ли недостаток специалистов)? Сообщество растети или уменьшается?


#2

Как мне кажется, ответ на 1-2 вопрос сильно зависит от:

  • во-первых, того, что мы считаем профессиональной деятельностью, а что нет,
  • во-вторых, того, где мы проводим границу между компьютерной лингвистикой и всем остальным.

Если оценивать количество активных участников (по публикациям, участию в проектах и конференциях), я бы сказал - человек 100 максимум. И это очень, очень мало.

Зато из моего угла кажется, что сообщество медленно растёт.


#3

В мире накопилось слишком много текстовых данных, чтобы их игнорировать и не пытаться обрабатывать с целью получения тех или иных преимуществ. Мне тоже кажется, что сообщество медленно, но всё-таки растёт.


#4

Мне кажется, что оценка Дмитрия Грановского слишком пессимистична. Я бы сказал, что сообщество на порядок больше. Почему?

Во-первых, только в “Диалоге” участвует куда больше 100 человек. В тех же соревнованиях “Диалога” в общей сложности участвует куда больше больше оценочно 10 групп. А группы обычно довольно большие.

Во-вторых, многие группы довольно закрытые. Например, Лаборатория компьютерной лингвистики ИППИ РАН состоит из 15 человек, но ЭТАП относительно закрыт, публикационная деятельность тоже не очень активна. Так исторически сложилось. И мне кажется, так поступает большинство групп.

В-третьих, есть достаточно большое число компаний, которые занимаются обработкой текстов. Но скорее не ведут исследования, или не публикуются.


#5

Кстати, в качестве источника данных можно взять наши каталоги организаций, мероприятий и учесть людей, которые отметились в персоналиях. Кстати, записывайтесь, да :slight_smile:

Предполагаю, наберётся несколько сотен специалистов. Однако зачастую люди начинают заниматься NLP в качестве какой-либо рабочей задачи, потому что доступные инструменты бывают недостаточно хороши для её решения.

Для сравнения, в робототехнике и связанных дисциплинах приток новичков гораздо сильнее, потому что можно сразу увидеть и пощупать результаты собственных усилий.


#6

Я специально оговорился про активных участников. Понятно, что неактивных (тех, которых снаружи не видно) больше, но их я не знаю, как считать.


Чем является nlp для вас?
#7

Вообще это интересный вопрос, скажем, в таком разрезе. Предположим, я хочу открыть новую кафедру по компьютерной лингвистике. Или сделать конференцию. Или учредить грант, или ещё что-нибудь такое с целью типа “способствовать развитию отрасли в России”. Размер сообщества мог бы быть одним из KPI для такого проекта.


#8

В первую очередь я имел ввиду под профессиональной деятельность в области АОТ/КЛ

  • людей работающих в “академии” (профессора, исследователи и аспиранты
    работающие в институтах, университетах и других академических
    заведениях)
  • людей работающих в индустрии (разработчики и исследователи работающие в коммерческих организациях)

Действительно, очень интересно было бы посмотреть на разные срезы сообщества. Сколько работает в индустрии? Сколько в академии? Сколько регулярно публикуются в отечественных и сколько в зарубежных конференциях?

У меня возникло ощущение, что в русскоязычном сообществ “доминирует” индустрия, в то время как в европейском на переднем фронте скорее академия. А вы как думаете?


#9

Кстати говоря, было бы здорово если бы существовала русскоязычная ассоциация людей профессионально связанных с компьютерной лингвистикой вроде англоязычной ACL (http://www.aclweb.org/portal/user/register) или франкоязычной ATALA (http://www.atala.org/-L-association-), членами которых я кстати являюсь :-). Или может что-нибудь такое уже существует?

ACL существует с 1962 года, а ATALA судя по их сайту аж с 1959!


#10

Мне всегда казалось, что РОМИП или Диалог являются именно таким органом. Разве не так? Забавно, но при создании NLPub я оглядывался на ACLWiki.


#11

Диалог - это, несомненно, тусовка, но явно не ассоциация. Ассоциация - это когда есть членство и бонусы от этого членства. И членские взносы :slight_smile:

Александр, а зачем быть членом ACL? Что это даёт? Может, в России и нет ничего такого, что могло бы стать бонусом для членов гипотетической ассоциации.


#12

Дима, я вступил в ACL и ATALA во-первых чтобы получить скидки на участие в конференциях. В случае ATALA это TALN (http://www.taln2013.org/, http://www.jeptaln2012.org/). В случае ACL это EMNLP 2011, EACL и др (http://www.aclweb.org/conference-list). Кроме этого, членство позволяет голосовать за президента ACL и т.п. http://portal.aclweb.org/ Да, можно еще конечно вписать куда-нибудь факт членства :slight_smile: