Janggu باعث می شود یادگیری عمیق نسیم

IMAGE

تصویر: دانشمندان آلتونا Akalin (سمت چپ) و ولفگانگ Kopp (راست) از “بیوانفورماتیک و Omics علوم اطلاعات” ، مشاهده بیشتر

اعتبار: فلیکس Petermann MDC

محققان از MDC را توسعه داده اند یک ابزار جدید است که باعث می شود آن را آسان تر برای به حداکثر رساندن قدرت یادگیری عمیق برای تحصیل در رشته ژنتیک. آنها توصیف رویکرد جدید Janggu در مجله Nature Communications.

تصور کنید که قبل از شما می تواند شام شما برای اولین بار تا به حال به بازسازی آشپزخانه به طور خاص طراحی شده برای هر دستور غذا. شما می خواهم به صرف زمان بیشتری را بر روی آماده سازی در واقع از پخت و پز. محاسباتی زیست شناسان آن را به یک شبیه وقت برای تجزیه و تحلیل داده های ژنومیک. قبل از آنها حتی می توانید شروع به تجزیه و تحلیل آنها, آنها صرف مقدار زیادی از زمان با ارزش قالب بندی و آماده سازی مجموعه داده های بزرگ برای تغذیه به یادگیری عمیق ،

برای ساده کردن این فرآیند محققان از حداکثر Delbrueck مرکز پزشکی مولکولی در انجمن هلمهولتز (MDC) توسعه جهانی ابزار برنامه نویسی که تبدیل طیف گسترده ای از ژنتیک داده ها را به فرمت مورد نیاز برای تجزیه و تحلیل عمیق مدل های یادگیری. “قبل از شما به پایان رسید تا هدر رفتن مقدار زیادی از زمان در جنبه های فنی به جای تمرکز بر بیولوژیکی سوال شما در تلاش بودند به پاسخ می گوید:” دکتر ولفگانگ Kopp یک دانشمند در بیوانفورماتیک و Omics داده های علمی گروه پژوهشی در MDC برلین موسسه پزشکی سیستم های زیست شناسی ؟ (BIMSB) و اولین نویسنده این مقاله است. “با Janggu ما هدف برای از بین بردن برخی از این ویژگی های بار و آن را در دسترس به عنوان بسیاری از مردم به عنوان امکان پذیر است.”

نام منحصر به فرد راه حل جهانی

Janggu است که پس از یک سنتی کره ای درام به شکل یک ساعت شنی تبدیل شده در کنار آن. دو بخش بزرگ از ساعت شنی نشان دهنده مناطق Janggu متمرکز شده است: قبل از پردازش داده های ژنومیک, نتایج تجسم و مدل ارزیابی است. باریک اتصال در وسط نشان دهنده یک حفره یا سوراخ برای هر نوع یادگیری عمیق مدل محققان مایل به استفاده از.

یادگیری عمیق مدل شامل الگوریتم های مرتب سازی از طریق مقادیر عظیم داده ها و پیدا کردن ویژگی های مرتبط و یا الگوهای. در حالی که یادگیری عمیق است و یک ابزار بسیار قدرتمند و استفاده از آن در ژنتیک محدود بوده است. بسیاری منتشر شده مدل تمایل به تنها کار با ثابت انواع داده ها قادر به پاسخ تنها یک سوال خاص. تعویض و یا اضافه کردن داده های جدید اغلب نیاز به بیش از شروع از ابتدا و گسترده تلاش های برنامه نویسی.

Janggu تبدیل های مختلف ژنتیک انواع داده ها را به یک فرمت جهانی است که می تواند متصل به هر machine learning یا یادگیری عمیق که با استفاده از پایتون به طور گسترده ای با استفاده از زبان برنامه نویسی است.

“چه باعث می شود ما رویکرد ویژه ای است که شما به راحتی می توانید هر گونه استفاده از داده های ژنومی برای یادگیری عمیق و مشکل هر چیزی می رود در هر قالب” دکتر آلتونا Akalin که سر بیوانفورماتیک و Omics داده های علوم تحقیقات ،

جدایی کلیدی است

Akalin پژوهش است در دو ماموریت: توسعه جدید یادگیری ماشین ابزار و استفاده از آنها به بررسی سوالات زیست شناسی و پزشکی است. در طول تحقیقات خود تلاش های آنها به طور مستمر نا امید چقدر زمان صرف شد قالب بندی داده ها. آنها متوجه شدم بخشی از مشکل این بود که هر یک یادگیری عمیق مدل شامل داده های خود را قبل از پردازش. با جدا کردن استخراج داده ها و قالب بندی از تجزیه و تحلیل آن را فراهم می کند یک راه بسیار ساده تر برای تبادل ترکیب و یا استفاده مجدد از بخش داده است. این نوع مانند داشتن تمام ابزار آشپزخانه و مواد تشکیل دهنده در نوک انگشتان خود را آماده برای امتحان کردن یک دستور جدید.

“مشکل پیدا کردن تعادل مناسب بین انعطاف پذیری و قابلیت استفاده” Kopp می گوید. “اگر آن را بیش از حد انعطاف پذیر و مردم را غرق در گزینه های مختلف و آن را دشوار است برای گرفتن آغاز شده است.”

Kopp آماده کرده چند آموزش برای کمک به دیگران شروع به استفاده از Janggu همراه با مثال داده و مطالعات موردی. این طبیعت ارتباطات کاغذ نشان می دهد Janggu را تطبیق پذیری در دست زدن به بسیار حجم زیادی از داده ها ترکیب جریان اطلاعات و پاسخ به انواع سوالات از قبیل پیش بینی محل های اتصال از توالی DNA و/یا کروماتین دسترسی و همچنین برای طبقه بندی و رگرسیون وظایف.

کاربردهای بی پایان

در حالی که بسیاری از Janggu بهره مند است که در پایان مقابل این محققان می خواستم به ارائه یک راه حل کامل برای یادگیری عمیق. Janggu همچنین شامل تجسم نتایج پس از یادگیری عمیق تجزیه و تحلیل و ارزیابی چه مدل آموخته است. قابل توجه تیم incorporated “مرتبه بالاتر توالی کد کننده” به این بسته است که اجازه می دهد تا به ضبط همبستگی بین همسایه نوکلئوتید. این کمک به افزایش دقت در برخی از تجزیه و تحلیل. ساخت یادگیری عمیق تر و بیشتر کاربر پسند Janggu کمک می کند تا پرتاب باز کردن درب به پاسخ دادن به همه انواع بیولوژیکی سوالات.

“یکی از جالب ترین برنامه های کاربردی است که پیش بینی اثر جهش در ژن مقررات” Akalin می گوید. “این هیجان انگیز است چرا که در حال حاضر ما می توانید شروع به درک فردی ژنوم مثلا ما می توانیم با دقت اشاره کردن انواع ژنتیکی است که باعث تغییرات قانونی و یا ما می توانیم تفسیر نظارتی جهش های رخ داده در تومورها است.”

###

حداکثر Delbrueck مرکز پزشکی مولکولی (MDC)

حداکثر Delbrueck مرکز پزشکی مولکولی در انجمن هلمهولتز (MDC) تاسیس شد و در برلین در سال 1992. آن است که به نام, آلمانی-آمریکایی فیزیکدان حداکثر Delbrueck که اهدا شد در سال 1969 جایزه نوبل در فیزیولوژی و پزشکی است. MDC ماموریت است که به مطالعه مکانیسم های مولکولی به منظور درک ریشه های بیماری و در نتیجه قادر به تشخیص پیشگیری و مبارزه با آن را بهتر و بیشتر به طور موثر. در این تلاش MDC همکاری با Charite – Universitaetsmedizin برلین و برلین موسسه بهداشت (BIH ) و همچنین با شرکای ملی مانند آلمان و مرکز تحقیقات قلب و عروق و متعدد بین المللی موسسات تحقیقاتی. بیش از 1600 پرسنل و مهمانان از حدود 60 کشور در MDC فقط تحت 1,300 از آنها در تحقیقات علمی است. MDC این است که بودجه فدرال آلمان وزارت آموزش و پرورش و پژوهش (90 درصد) و ایالت برلین (10 درصد) و عضو انجمن هلمهولتز آلمان مراکز تحقیقاتی. http://www.mdc-برلین.د

سلب مسئولیت: AAAS و EurekAlert! مسئول صحت اخبار منتشر شده به EurekAlert! با کمک موسسات و یا برای استفاده از هر گونه اطلاعات از طریق EurekAlert سیستم.

tinyurlis.gdu.nuclck.ruulvis.netshrtco.de