• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

© Высшая школа экономики

В этом году участники Всероссийской олимпиады школьников по искусственному интеллекту впервые смогут зачесть ее результаты при поступлении в вузы. Елена Кантонистова, председатель методической комиссии олимпиады и академический руководитель онлайн-магистратуры факультета компьютерных наук «Машинное обучение и высоконагруженные системы», рассказала новостной службе «Вышка.Главное» о том, как ученые ВШЭ составляли задания для соревнований 2023 года, откуда взялась задача об уссурийских тиграх и почему школьникам полезно осваивать ИИ.

Во Всероссийской олимпиаде школьников по искусственному интеллекту могут участвовать ученики 8–11-х классов. Первые два этапа, отборочный и основной, проходят онлайн. Лучшие 50 участников, отобранные по их результатам, приезжают в Москву на заключительный очный финал.

В олимпиаде есть задания по математике, алгоритмам, машинному обучению. В 2023 году в отборочном и основном этапах было по два задания по каждому направлению. В отборочном этапе задания несложные и доступные всем участникам, добросовестно изучившим школьную программу по математике и информатике. В основном этапе задания уже сложнее, а в заключительном — всего две задачи по машинному обучению, но обе довольно непростые.

Елена Кантонистова

В прошлом году большинство членов методической комиссии, которая разрабатывает задания, были сотрудниками факультета компьютерных наук Вышки.

Расскажу подробнее о заданиях по машинному обучению, так как они представляют наибольший интерес и являются основными в олимпиаде. В 2023 году в отборочном этапе была классическая задача регрессии, то есть прогноз на основе набора данных с различными признаками. Участникам нужно было предсказать стоимость домов по различным характеристикам.

Вторая задача была посвящена несложному и интересному анализу данных. Летом один из российских заповедников предоставил нам данные о наблюдениях за животными: например, где и когда видели северных оленей, волков, уссурийских тигров, что они при этом делали и так далее. Участникам нужно было ответить на вопросы по этим данным, от несложных (сколько пропусков в данных, какой зверь встречается людям чаще всего) до довольно хитрых (например, какое животное было замечено осенью 2022 года ближе всего к центру Москвы или какое животное чаще всего уличают в кражах).

Такие несложные, но содержательные по смыслу задачи — очень хорошее подспорье, чтобы заинтересовать школьников, только начинающих свой путь в анализе данных. Для решения не нужно знать никаких сложных алгоритмов, но при этом придется поизучать данные и их особенности, чтобы получить ответ.

В основном этапе задачи были уже сложнее. Одна задача требовала построения рекомендательной системы: на основе информации о пользователях «ВКонтакте» нужно было порекомендовать им группы, которые могут им понравиться. Вторая задача тоже была нестандартная: по описанию вакансии спрогнозировать среднюю зарплату, которую будет получать сотрудник. Для решения этих задач уже нужно иметь опыт в решении разнообразных задач машинного обучения.

© Высшая школа экономики

Все задачи подобраны таким образом, чтобы от тура к туру их сложность возрастала. Кроме того, нам не хотелось повторяться в темах, поэтому все задачи были разнотипными и из разных областей. Наконец, самое непростое: так как олимпиада имеет статус всероссийской, то в ней не могут использоваться стандартные открытые наборы данных (датасеты). Необходимо было найти новые датасеты для задач, а это всегда большая проблема. В итоге, конечно, все разрешилось: какие-то данные члены методической комиссии собрали сами, а какие-то предоставили коллеги из больших технологических компаний (а также заповедник).

В заключительном этапе была одна относительно несложная задача — предсказать вероятность клика по рекламному объявлению (на табличных данных) — и одна очень интересная: image-text matching. Здесь нужно было обучить модель, которая по паре (картинка и текст) предсказывает степень их смыслового соответствия. Разработчики задач пытались поставить участников в ситуацию из реальной жизни, где данные не идеальны. Особенностями обеих задач был умышленный data leak (утечка данных). При нахождении утечки можно было значительно улучшить качество прогноза в задаче и подняться на первые позиции в рейтинге.

В итоге многие ребята успешно справились с задачами, и участники из топа рейтинга показали очень хорошие результаты.

Для школьников участие в этой олимпиаде не только интересно, но и полезно. Перед каждым этапом проходят подготовительные вебинары — их тоже проводила по большей части команда преподавателей ФКН. После окончания этапов проводились разборы заданий. Также участникам предоставили список материалов для изучения, чтобы им легче было справиться с заданиями олимпиады.

У команды разработчиков было много трудностей. Одна из основных — составить задачи так, чтобы их нельзя было решить современными генеративными моделями (речь, в частности, о ChatGPT). То есть сами задачи не должны быть стандартными, а также должны иметь формулировки, в которых разберется человек, но пока не разбираются генеративные модели. В прошлом году нам удалось составить такие задания. Дальше, конечно, будет сложнее.

В этом году олимпиада примет еще большие масштабы, так как ее результаты можно будет учесть для поступления в вузы. Мы надеемся поучаствовать в составлении заданий и для следующих олимпиад.

Вам также может быть интересно:

НИУ ВШЭ — лидер среди вузов по вкладу в развитие ИИ

15 мая состоялось вручение премии «AI Awards: создатели будущего 2024».  Команда по искусственному интеллекту и цифровым продуктам «Билайна» Big Data & AI* совместно с Brand Analytics объявили победителей рейтинга искусственного интеллекта, который составила нейросеть. Вышка стала победителем в индустриальной номинации «Вузы. Вклад в развитие ИИ».

Ученые Вышки ускоряют разработку беспроводных систем связи 5G и 6G с помощью ИИ-технологий

В Центре искусственного интеллекта НИУ ВШЭ разработали программное обеспечение для моделирования радиоканала в беспроводной связи 5G и 6G, основанное на использовании трассировки лучей и машинного обучения. Программы позволяют узнать, как радиоволны распространяются между передатчиком и приемником, а также могут преобразовывать данные трассировки лучей в формат последовательности кадров, конфигурировать и обучать нейросеть на их основе с последующим сохранением.

«Новый стратегический проект усилит наши компетенции в области искусственного интеллекта»

Высшая школа экономики в рамках программы «Приоритет-2030» запускает новый стратегический проект «ИИ-технологии для человека». О том, какие задачи он решает, какие проекты войдут в его состав, зачем нужны конкурсы молодых ученых и компетенций и что будут делать ИИ-помощники для человека, в интервью «Вышке.Главное» рассказал научный руководитель стратпроекта, директор Института искусственного интеллекта и цифровых наук НИУ ВШЭ Алексей Масютин.

На площадке НИУ ВШЭ опубликована «Белая книга» оценки соответствия искусственного интеллекта

Технический комитет по стандартизации №164 «Искусственный интеллект», действующий на площадке НИУ ВШЭ, совместно с Палатой индо-российского технологического сотрудничества (CIRTC) и ассоциацией «РУССОФТ» опубликовали «Белую книгу» оценки соответствия искусственного интеллекта. В ней отражены подходы к стандартизации и этическому регулированию технологий ИИ в двух пилотных отраслях — здравоохранении и сельском хозяйстве.

«Подобно электричеству, ИИ может принести невероятную пользу»

Разработки в сфере искусственного интеллекта постепенно занимают ведущее место во всем мире. ИИ может принести невероятную пользу мировой экономике и благосостоянию, но порождает новые вызовы. Об этом в своем докладе рассказал профессор Университета Флориды, научный руководитель Лаборатории алгоритмов и технологий анализа сетевых структур нижегородской Вышки Панос Пардалос.

Быть, а не казаться: как вырастить из ИИ профессионала

Пока ученые спорят о пользе и вреде искусственного интеллекта, молодежь активно осваивает и интегрирует нейросети в свою жизнь, приспосабливая нашу реальность к новым условиям. О том, как дообучить LLM, чтобы они смогли служить полноценными ассистентами в профессиональной среде, обсудили в Вышке на воркшопе «Большие языковые модели в науке и в жизни».

«Нам нужно учиться общаться с сервисами искусственного интеллекта»

На платформе «Открытое образование» стартовал онлайн-курс «Что такое генеративный ИИ?», который поможет слушателям узнать больше о том, как правильно общаться с нейросетями, чтобы они лучше выполняли задачи. Как работает генеративный ИИ и как с его помощью создавать любой контент, рассказала эксперт Центра непрерывного образования, старший преподаватель департамента больших данных и информационного поиска ФКН Дарья Касьяненко.

«Специалист по Data Science» ВШЭ — первая программа переподготовки с аккредитацией Альянса в сфере ИИ

Согласно итогам экспертизы, программа Высшей школы экономики охватывает современные области анализа данных и машинного обучения и помогает нетехническим специалистам приобрести базовые знания в области больших данных и искусственного интеллекта. Это уже шестая образовательная программа факультета компьютерных наук НИУ ВШЭ, получившая престижную профессионально-общественную аккредитацию.

В Вышке стартует конкурс компетенций в области ИИ и машинного обучения

Дирекция программы развития НИУ ВШЭ объявляет о проведении конкурса компетенций в интересах развития исследований в области искусственного интеллекта и машинного обучения. Заявки принимаются до 2 мая 2024 года.

Что мы знаем о мозге и его возможностях: рассказывают исследователи ВШЭ

Правда ли, что мозг — самый неизученный орган? Как нейротехнологии помогают в лечении сложных заболеваний? Может ли искусственный интеллект соревноваться с естественным? И куда пойти учиться, чтобы стать нейроученым? Эти и другие темы в новом выпуске рубрики «Разговор с экспертом» обсудили ученые из Высшей школы экономики — Ольга Драгой, Андрей Мячиков и Алексей Осадчий.