Big Data появились официально, как категория, в 2008 г, когда Nature так отразил актуальность инновационных технологий обработки и визуализации растущей мировой информации. Большие данные развиваются стремительно, например, технологичные предприятия генерируют от 100 Тбайт данных ежедневно.
Идет динамичное исследование больших массивов данных, не поддающихся обработке традиционными методами, базами данных (БД) и СУБД. Одной из первых сфер применений стало здравоохранение. В нем ожидания граждан в пандемию всё выше, информация всё ценнее, а обработка данных часто критическая.
Цели, принципы и возможности
Big Data – инновационная технология обработки, анализа, визуализации информации и выводов из нее. Там, где обычные БД, СУБД и процедуры аналитики бессильны (даже при наличии облачных хранилищ), она позволяет обрабатывать разнородные массивы данных на разнотипных носителях, приложениях и устройствах. Например, позволяет охватить в реальном режиме мировые данные по COVID-19 и их симптомам.
Цели Big Data отражены в принципах «5V»:
1) Volume – обработать большой объем данных;
2) Velocity – увеличить скорость обработки;
3) Variety – одновременно обрабатывать разноформатные данные;
4) Value – извлекать из данных полезное;
5) Veracity – релевантно выводить связи данных.
Аналитика на основе Big Data (ею занимается Data Mining) по востребованности стоит лишь после «древних» систем искусственного интеллекта и облачных вычислений, что подтверждает специальный рейтинг «IT-тренды 2020 России».
Big Data стали интенсивно применяться для интеллектуализации не только обработки данных, но и принятия решений. Они позволяют точно описывать ситуацию в медицине и здравоохранении, персонализировать подход к пациенту и работать с каждой инфраструктурной группой – поставщики данных, программ, технологических комплексов и сервиса. Например, как в нейросетевом алгоритме «Палех» от Яндекса.
Большие данные упрощают процессы, повышают удовлетворенность и ожидания пользователей, ускоряют взаимодействия и помогают реализовать дальнейшую стратегию работы, адаптироваться к пациенту.
Применение и перспективы BigData в здравоохранении, медицине
В применении Big Data заинтересованы все медики, не только эпидемиологи – для сбора, анализа данных, совершенствования диагностики, стратегий лечения. Медицина и здравоохранение становятся высокотехнологичными, с новой цифровой инфраструктурой и сервисом. Например, Big Data (точнее, совместно с Data Mining) позволяет уже по анализам крови идентифицировать онкозаболевания и предрасположенность, оказывать вовремя помощь, предотвращая тяжелые случаи.
В пандемию важность Big Data выросла сильно: все важнейшие государственные решения, например, карантинные, связаны с ними, с проблемой, как минимизировать ущерб здоровью и экономике. Идет реинжиниринг инфраструктур медицины и здравоохранения для высокого (порядкового) роста качества обслуживания пациентов и работы врачей.
Применение Big Data позволяет успешно решать в реальном режиме, удаленно задачи:
1) анализа заявок;
2) обучения медицинским системам (МИС);
3) мониторинга состояния, лечения;
4) теле-видео-консалтинга;
5) развития БД с поддержкой баз врачами, лаборантами и самими пациентами;
6) принятия клинических решений;
7) документооборота по стандартам XML, RCC и др.
Big Data дают возможность принять решения в медицине, используя машинные фильтрацию и таксономию, объяснения по источникам различных данных (клинические, фармакологические, «неотложки», «страховщиков», научные). Например, используя базы PubMed, программы визуализации VOSviewer. Big Data помогают при комплексном анализе данных в реальном времени, в частности, при геномном анализе для выявления или прогноза лейкоза.
Объединяя мощности вычислительных и Big Data систем можно работать, например, с изображениями тысяч срезов на томографе, обратными связями со всеми пациентами с помощью е-карт пациента и цифрового его профиля от раннего детства. Такие Big Data системы уже есть – Project Artemis (ежесекундное отслеживание 1260 показателей младенцев), QPID (сквозной контроль пациента с прогнозированием хирургических рисков).
Сейчас в медицинских системах (МИС) обработка данных ведется централизованно с помощью традиционных БД (СУБД), например, SQL-ориентированных, хорошо структурируемых, а сами данные измеряются в диапазоне «Гигабайты-Терабайты». В будущем, Big Data позволят перейти (по оценкам экспертов) к децентрализованной обработке данных диапазона «Терабайты-Петабайты», плохо структурируемых массивов данных, с извлечением намного больше ценной информации. Эти массивы будут включать графики, рисунки, медицинские описания и заключения, звукозаписи, видео. Кроме информативности, повышается и оперативность медицинских решений (примерно на треть), а также сервисные возможности обработки заявок, анализа состояния. Нельзя забывать, Big Data вместе с машинным обучением, нейросетями и робототехникой (медицинскими системами типа «Интернет вещей») способны решать ранее нерешаемые распределенные задачи медицины, например, прогноза сахарного диабета, снижения ее латентности (скрытого течения), ведь более 60% потенциальных диабетиков и не догадываются о грозном диагнозе!
На основе Big Data разрабатываются также платформы биометрии (например, «HealthNet») и непрерывного мониторинга состояния спортсменов.
Big Data – инструментарий снижения транзакционных издержек, эффективного реагирования. Это система объединенной работы IT-специалистов, математиков, биологов, химиков, медиков, фармацевтов, организаторов здравоохранения.
Нет комментариев