15
Календарь конференций
  • 14 – 16 сентября

    Международная научно-практическая конференция «Эксперимент в хирургии и онкологии»

  • 18 – 21 сентября

    I Всероссийская конференция преподавателей кристаллографии

  • 25 – 26 октября

    Научно-практическая конференция студентов, магистрантов и аспирантов III Молодежные Губеровские чтения "Юго-Восточная Азия: историческое развитие и социально-политическая трансформация"

  • 25 октября

    Шестая ежегодная научная конференция консорциума журналов экономического факультета МГУ имени М.В. Ломоносова

  • 13 – 15 ноября

    Международная научная конференция «Добро и зло на Востоке: этика, политика, экономика»

  • 22 – 24 ноября

    Ежегодная Всероссийская научная конференция с международным участием «Наука в вузовском музее»

  • 23 – 25 ноября

    Международная научно-практическая конференция "Государство и право России в современном мире"

  • 23 – 25 ноября

    V Национальный конгресс по регенеративной медицине

Все конференции

Нейросеть от ученых МГУ оцифровала 10 тысяч астрономических рукописей о солнечной активности

Сотрудники МГУ вместе с пермскими и немецкими коллегами смогли перевести в цифровой формат тысячи рукописей о солнечной активности конца XIX — начала XX веков из обсерватории в Цюрихе. В этом им помогла нейросетевая модель, которая способна с высокой точностью читать написанные от руки тексты. В результате авторы смогли детально восстановить картину солнечной активности за более чем 30 лет наблюдений, что позволит астрономам уточнить представления о характере солнечной активности и особенностях солнечных циклов того времени. Результаты работы, поддержанной грантом Российского научного фонда, опубликованы в журнале Solar Physics.

Человечество наблюдает солнечные пятна с помощью телескопов уже более четырех веков. В те далекие времена записи велись от руки, а в наше время специалисты занимаются их расшифровкой и оцифровкой. Занятие этим вручную — долгий и трудоемкий процесс, а потому специалисты прибегают к помощи искусственного интеллекта. 

В своей новой работе исследователи Московского университета совместно с коллегами из Института механики сплошных сред УрО РАН (Пермь) и Потсдамского астрофизического института имени Лейбница (Германия) занялись переведением в цифровой формат рукописей о солнечной активности конца XIX — начала XX веков из обсерватории в Цюрихе.

«Мы разработали нейросетевую модель, которая с высокой точностью читает рукописный текст. В нашем случае текстом были координаты активных областей Солнца, записанные в таблицы. Примечательно, что ни одна из готовых программ, которые мы тестировали в начале процесса, не показывала удовлетворительного качества. Поэтому пришлось разрабатывать собственную модель — за это отвечали сотрудники МГУ», — рассказал Егор Илларионов, кандидат физико-математических наук, доцент кафедры теории вероятностей механико-математического факультета МГУ.

Несколько особенностей делают модель уникальной. Во-первых, помимо результата распознавания, она возвращает оценку уверенности как в числе целиком, так и в каждом отдельном символе, составляющем число, и предлагает набор возможных интерпретаций. Это помогает при дополнительной проверке результатов. Во-вторых, удалось разработать процедуру, которая позволяет модели «в режиме онлайн» адаптироваться под новые стили почерка (наблюдатели, заполнявшие каталог, неоднократно менялись за 30 лет) и особенности страниц. Это позволило значительно повысить точность по сравнению с моделью, которая работает с фиксированными предобученными параметрами.

С помощью разработанной нейросетевой модели удалось впервые оцифровать (прочесть) более десяти тысяч страниц рукописных каталогов по солнечной активности на рубеже XIX—XX веков. В результате удалось восстановить детальную картину положений солнечных пятен, факелов и протуберанцев за более чем 30 лет наблюдений. Это позволит астрономам лучше узнать прошлое Солнца, уточнить представления о характере солнечной активности и особенностях солнечных циклов в историческом периоде.

«В работе нужно выделить два аспекта. Во-первых, опубликован новый детальный датасет, охватывающий более чем 30 лет наблюдений, проводимых Цюрихской обсерваторией (одной из старейших в мире) в конце XIX — начале XX веков. Этот набор данных существенно уточняет наше представление о характере солнечной активности в историческом периоде и теперь доступен для исследования специалистам по солнечной физике. Во-вторых, предложенная технология распознавания текста в документах может быть адаптирована к самым разным задачам, в частности там, где ручная обработка оказывается слишком трудоемкой из-за больших объемов текстов», — подытожил Егор Илларионов.