Приложение на CORBA



Начало
Общи сведения за CORBA
OMG и архитектура на CORBA
Обектен модел на CORBA
Езикът IDL
Проект BioStandards
  • Планирана употреба
  • Обезпечаване на данните
  • Управление на проекта
  • Извод
  • Използване на CORBA в разработки на EBI
  • Приложение на CORBA в пациентските регистри
    Приложение на CORBA в телероботиката
     
     

    Обезпечаване на данните


        Участниците в този проект са избрани да осигурят голям диапазон от данни, в съответстиве със сферата в която са компетентни тези партньори. Доставчиците на данни имат за задача да дефинират данните, с които ще участват в проекта. Тази дефиниция може да бъде изказана чрез IDL. Обектните интерфейси ще бъдат достъпни за другите членове на проекта посредством CORBA. Това ще доведе до реализирането на тази инфраструктура и разработването на механизъм за достъп до съществуващите им източници на данни.

        Европейският институт по биоинформатика (European Bioinformatics Institute, EBI) в момента поддържа две солидни бази данни : EMBL nucleotide sequence database и SwissProt protein sequence database. Напоследък Европейският институт по биоинформатика стартира сътрудничество с Банка данни за протеините (Protein Databank, PDB) , при което ще бъде подпомогнато поддържането на Базата Данни за Макормолекулярни Структури (Macromolecular Structure Database, MSD). Към момента е подсигурено абсолютно независимото съществуване на тези бази данни, като препратките във flat-файлови формати дават съществен принос към интероперативността. Европейският институт по биоинформатика е в процес на рационализиране на вътрешната си инфраструктура, в която CORBA ще има централна роля. Като част от работата си по проекта Европейският институт по биоинформатика използва резултатите от тази рационализация и ще разработи необходимите подобрения, за да осигури един цялостен вид на трите бази данни, достъпен за външните потребители.

    Нови бази данни

        Все по-нарастващ е броят на нововъзникващите бази данни, които като цяло се поддържат от един или няколко молекулярни биолози със специализирани интереси. Техните данни в бази имат отношение към данните в определени бази данни, като така се установяват ценни връзки между тези бази данни. От съществено значение е тези новосъздадени бази данни да бъдат направени интероперативни с установените вече бази данни, за да бъде достъпна ценната информация в тях. Три от тези бази данни са включени в този проект, като всяка от тях има своите специфични причини за това. Тези бази данни са:
          TRANSFAC, управлявана от GBF е база данни, съдържaща информация за трансктипционни фактори. TRANSFAC е към момента единствената поддържана и публичнодостъпна база данни, съдържаща подобна информация. Тя осигурява връзките между много други бази данни, включително и няколко от участващите в проекта, като EMBL, SwissProt и PIR (Protein Information Resource).
         P53, поддържана от IARC (International Agency for Research on Cancer- Международна Агенция за Изследвания на Рака) е база данни за P53 мутациите на човешки туморни клетки и клетъчни линии събрани от научната литератира. Този източник на данни съдържа виртуална информация която може да носи указания за намесата на канцерогени от околната среда при развитието на тумори. P53 е пример за база данни с една от многото възможни мутации и ще служи за модел при включването на други.
         RHdb, управлявана от Европейския Институт по Биоинформатика (EBI) е база данни, съдържаща информация за необработени радиационни хибриди. Данните за радиационните хибриди се използват при генерирането на алтернативни генетични карти, тъй като те могат да включват неполиморфни маркери и в същото време са достатъчно мощни да предопределят колебаещи се генетични струпвания на полиморфни STS. Тази база данни е продукт от международен сътруднически проект, който ще осигури голямо количество подобна информация. Включването на тази база данни за в бъдеще ще засили въвеждането на картова информация.
    Европейския Институт по Биоинформатика ръководи включването на тези бази данни в тясно сътрудничество с групите, които ги управляват.
     

    Допълнителни услуги и клиентски приложения

        След като инфраструктурата на CORBA и известен брой обектни интерфейси са налице ще започне и развитието на приложенията, които използват тези интерфейси. Те включват допълнителни услуги и генерирането на клиентски приложения.

    EBI

    Предоставените от Европейския Институт по Биоинформатика IDL спецификации осигуряват интегрирания вид на поддържаните данни (EMBL, SwissProt & MSD). EBI поддържа известен брой свързани външни услуги, като например последователно търсене (FASTA, MPsrch). Тези услуги постоянно се подобряват и към тях се добавят нови такива. EBI осигурява интерфейси за такива услуги като част от тяхната IDL дефиниция. Ясно е също така, че има случаи, при които ще са необходими стандартни клиентски приложения. Пример за такова е гъвкаво приложение, което с помощта на подходяща преформатираща информация е в състояние да генерира доклади с данни в различните flat-file формати, с които сме добре запознати. За в бъдеще разпространението и съхранението на данни в flat-file ще бъде заменено от по-подходящите DBMS. EBI изследва също така непознатите досега връзки между интерфейсите, поддържащи данни, в които се включват EST и RHdb при подреждането и събирането на информация от всички налични източници на данни при опитите да се поддържа генокарта на различните геноми.

    INFOBIOGEN

    INFOBIOGEN има прототип на обектно-ориентирана DBMS, IDB, която бе използвана за изграждането на базата данни HUGEMAP. С участието си в този проект тази база данни бе разработена в съответствие със стандартите, дефинирани от Групата за управление на обектни бази данни (ODMG, Object Database Management Group). ODMG е член на OMG, който взема активно участие в дефинирането на стандарти за DBMS. INFOBIOGEN заема важно място в сферата на биоинформатиката. Те имат за цел да оперират с копията от данните на външните източници. INFOBIOGEN осигурява завършен прототип на интеропертивна система, построена чрез следните продукти:

          ORB Посредник при запитвания за обекти е интегриран в системата на IDB. Този ORB се използва, за да осъвременява данните и да позволява достъп до поддържаната в базата данни информация.

          Изследва се достъпът чрез използване на езици за програмиране на високо ниво, а също така с помощта на тези езици се разработват примерни приложения. Сравнително прости Java програми са в състояние да осигурят относително сложна функционалност. Разпределените приложения могат да бъдат написани така, че да не изискват порт-ване към множество платформи, след като Java виртуалната машина е на разположение на тези платформи. Крайните потребители печелят от това, тъй като те са запознати с www и не им се налага да инсталират каквото и да било. Интегрираният вид се реализира веднага след като бъде установена основната инфраструктура на услугите. Тези модели са виртуален модели, дефинирани в IDL. Моделите са виртуални в смисъла на това, че те са конструирани като съставни обекти извлечени от източниците, определени чрез CORBA.

    MIPS

    MIPS (Microprocessor without interlocked pipeline stages) разработва цялостен вид за PIR- Международна База Данни за протеини и TRANSFAC, в сътрудничество с GBF.

    BMC

    BMC разработва интегриарн вид на mapping данните за Nucleotide Sequence Database в сътрудничество с Европейския Институт по Биоинформатика (EBI).

    Опорни точки на проекта

        При стартирането на проекта се набляга върху спецификациите на обектните интерфейси и изпълнението на тези интерфейси. Във втората част на проекта се поставено ударение на подсигуряването на допълнителни услуги и на разработката на клиентски приложения.

    Фази на проекта

    1. Спецификации

        Всеки от партньорите осигурява деайлна IDL спецификация за своите данни. Тези спецификации и свързаната с тях пояснителна документация се представят на обща среща на всички партньори.

    2. Обединяване

        IDL дефинициите на участниците в проекта и общите дефиниции се стабилизират и става възможно разработката да се фокусира върху съставните обекти, изградени от съществуващите IDL дефиниции. В този смисъл IDL дефинициите за малки бази данни съществуват и изпълнението на техните интерфейси е подобрено в значитена степен.

    3. Приложение

        Когато IDL дефинициите и приложенията са налице, участниците в проекта могат да се съсредоточат върху използването на интерфейсите. Разработват се прототипни приложения.

    4. Заключения

        Последната среща на партньорите в това сътрудничество (в края на третата година) се насрочва, за да бъде дадена критична оценка на CORBA и езика за интерфейсни дефиниции. Сътрудничеството на групите, поддържащи базите данни, разпространителите на информация и софтуерни разработчици осигурява възможността за свързване на биологични бази данни. То също така служи за оценка на способността технологията да бъде използвана в общата методология за обединяване на базите данни. Тази оценка показва доколко успешен е проектът за изпълнението и подпомагането на този стандарт.

    Етични, социални, икономически и екологични влияния

        Проектът събира в едно огромни количества данни и услуги и осигурява достъп до тях по един и същи начин. Това има неоциеним принос в сферата на научните, икономическите, социалните и екологичните фактори в Европа и по света. Резултатите от този проект не само допринасят с икономически изгоди от спестяването на време и средства при използването на данни от различни източници, но и улесняват научните открития с изграждането на своеобразен мост при използването на отделните източници на данни. Тези открития сами по себе си допринасят с допънителни ползи както в академичната общност, така и в производството.