Οι ιοί κάνουν μυστηριώδη πράγματα παντού - Η τεχνητή νοημοσύνη μπορεί να βοηθήσει τους ερευνητές να καταλάβουν τι κάνουν στους ωκεανούς και στο έντερο σας

Οι ιοί είναι μια μυστηριώδης και ελάχιστα κατανοητή δύναμη στα μικροβιακά οικοσυστήματα. Οι ερευνητές γνωρίζουν ότι μπορούν να μολύνουν, να σκοτώσουν και να χειραγωγήσουν ανθρώπινα και βακτηριακά κύτταρα σχεδόν σε οποιοδήποτε περιβάλλον, από τη θάλασσα μέχρι το έντερο. Αλλά οι επιστήμονες δεν έχουν ακόμη μια πλήρη εικόνα για το πώς οι ιοί επηρεάζουν το περιβάλλον τους, σε μεγάλο βαθμό λόγω της εξαιρετικής ποικιλομορφίας και της ικανότητάς τους να εξελίσσονται γρήγορα.

Οι μικροβιακές κοινότητες είναι δύσκολο να μελετηθούν στο εργαστήριο. Πολλά μικρόβια είναι δύσκολο να καλλιεργηθούν και το φυσικό τους περιβάλλον έχει πολύ περισσότερα χαρακτηριστικά που επηρεάζουν την επιτυχία ή την αποτυχία τους από αυτά που μπορούν να αναδημιουργήσουν οι επιστήμονες σε ένα εργαστήριο.

Ως εκ τούτου, οι βιολόγοι συστημάτων όπως εγώ συχνά αλληλουχούν όλο το DNA που υπάρχει σε ένα δείγμα – για παράδειγμα, το δείγμα κοπράνων ενός ασθενούς – διαχωρίζουν τις αλληλουχίες DNA του ιού και, στη συνέχεια, σημειώνουν τα τμήματα του ιικού γονιδιώματος που κωδικοποιούν τις πρωτεΐνες. Αυτές οι ενδείξεις σχετικά με τη θέση, τη δομή και άλλα χαρακτηριστικά των γονιδίων βοηθούν τους ερευνητές να κατανοήσουν τις λειτουργίες που μπορεί να επιτελούν οι ιοί στο περιβάλλον και βοηθούν στον εντοπισμό διαφορετικών τύπων ιών. Οι ερευνητές σχολιάζουν τους ιούς αντιστοιχίζοντας αλληλουχίες ιών σε ένα δείγμα με προηγούμενες σχολιασμένες αλληλουχίες που είναι διαθέσιμες σε δημόσιες βάσεις δεδομένων γενετικών αλληλουχιών ιών.

Ωστόσο, οι επιστήμονες εντοπίζουν αλληλουχίες ιών στο DNA που συλλέγεται από το περιβάλλον με ρυθμό που υπερβαίνει κατά πολύ την ικανότητά μας να σχολιάζουμε αυτά τα γονίδια. Αυτό σημαίνει ότι οι ερευνητές δημοσιεύουν ευρήματα σχετικά με τους ιούς σε μικροβιακά οικοσυστήματα χρησιμοποιώντας απαράδεκτα μικρά τμήματα των διαθέσιμων δεδομένων.

Για να βελτιώσουμε την ικανότητα των ερευνητών να μελετούν ιούς σε όλο τον κόσμο, η ομάδα μου και εγώ αναπτύξαμε μια νέα προσέγγιση για τον σχολιασμό αλληλουχιών ιών χρησιμοποιώντας τεχνητή νοημοσύνη. Χρησιμοποιώντας μοντέλα γλώσσας πρωτεΐνης, τα οποία είναι παρόμοια με μοντέλα μεγάλων γλωσσών όπως το ChatGPT αλλά ειδικά για πρωτεΐνες, μπορέσαμε να ταξινομήσουμε προηγουμένως άγνωστες αλληλουχίες ιών. Αυτό ανοίγει την ευκαιρία στους ερευνητές όχι μόνο να μάθουν περισσότερα για τους ιούς, αλλά και να απαντήσουν σε βιολογικά ερωτήματα που είναι δύσκολο να απαντηθούν χρησιμοποιώντας τις τρέχουσες τεχνικές.

Σχολιασμός ιών με AI

Τα μεγάλα γλωσσικά μοντέλα χρησιμοποιούν σχέσεις μεταξύ λέξεων σε μεγάλα σύνολα δεδομένων κειμένου για να δώσουν πιθανές απαντήσεις σε ερωτήσεις για τις οποίες δεν τους έχει «διδαχθεί» ρητά η απάντηση. Εάν ρωτήσετε ένα chatbot, “Ποια είναι η πρωτεύουσα της Γαλλίας;”, για παράδειγμα, το μοντέλο δεν θα αναζητήσει την απάντηση σε έναν πίνακα των πρωτευουσών. Αντίθετα, χρησιμοποιεί την εκπαίδευσή του σε τεράστια σύνολα εγγράφων και πληροφοριών για να βρει την απάντηση: «Η πρωτεύουσα της Γαλλίας είναι το Παρίσι».

Ομοίως, τα μοντέλα γλώσσας πρωτεΐνης είναι αλγόριθμοι τεχνητής νοημοσύνης εκπαιδευμένοι να αναγνωρίζουν σχέσεις μεταξύ δισεκατομμυρίων αλληλουχιών πρωτεϊνών από περιβάλλοντα σε όλο τον κόσμο. Μέσω αυτής της εκπαίδευσης, μπορεί να μπορέσουν να καταλήξουν σε κάτι σχετικά με τη φύση των ιικών πρωτεϊνών και τις λειτουργίες τους.

Αναρωτηθήκαμε αν τα μοντέλα γλώσσας πρωτεΐνης θα μπορούσαν να απαντήσουν σε αυτή την ερώτηση: «Δεδομένων όλων των σχολιασμένων αλληλουχιών ιικών γονιδίων, ποια είναι η λειτουργία αυτής της νέας ακολουθίας;»

Στην απόδειξη της ιδέας μας, εκπαιδεύσαμε νευρωνικά δίκτυα σε προηγούμενες σχολιασμένες αλληλουχίες ιικών πρωτεϊνών σε προεκπαιδευμένα μοντέλα γλώσσας πρωτεΐνης και στη συνέχεια τα χρησιμοποιήσαμε για να προβλέψουμε τον σχολιασμό νέων αλληλουχιών ιικών πρωτεϊνών. Η προσέγγισή μας μας επιτρέπει να εξετάσουμε τι «βλέπει» το μοντέλο σε μια δεδομένη ακολουθία ιών που οδηγεί σε έναν δεδομένο σχολιασμό. Αυτό βοηθά στον εντοπισμό ενδιαφέρων υποψήφιων πρωτεϊνών, είτε με βάση τις συγκεκριμένες λειτουργίες τους είτε τη διάταξη του γονιδιώματός τους, περιορίζοντας τον χώρο αναζήτησης τεράστιων συνόλων δεδομένων.

Μικροσκοπική εικόνα σφαιρικών, ανοιχτοπράσινων βακτηρίων

Με τον εντοπισμό απομακρυσμένων λειτουργιών ιικών γονιδίων, τα μοντέλα γλώσσας πρωτεΐνης μπορούν να συμπληρώσουν τις τρέχουσες μεθόδους και να παρέχουν νέες γνώσεις για τη μικροβιολογία. Για παράδειγμα, η ομάδα μου και εγώ μπορέσαμε να χρησιμοποιήσουμε το μοντέλο μας για να ανακαλύψουμε μια μη αναγνωρισμένη στο παρελθόν ιντεγκράση – έναν τύπο πρωτεΐνης που μπορεί να μεταφέρει γενετικές πληροφορίες μέσα και έξω από τα κύτταρα – στα παγκοσμίως κοινά θαλάσσια πικοκυανοβακτήρια Προχλωρόκοκκος Και Συνεχόκοκκοι. Συγκεκριμένα, αυτή η ιντεγκράση μπορεί να είναι σε θέση να μετακινήσει γονίδια μέσα και έξω από αυτούς τους βακτηριακούς πληθυσμούς στους ωκεανούς, επιτρέποντας σε αυτά τα μικρόβια να προσαρμοστούν καλύτερα στα μεταβαλλόμενα περιβάλλοντα.

Το γλωσσικό μας μοντέλο εντόπισε επίσης μια νέα ιική πρωτεΐνη καψιδίου που είναι ευρέως διαδεδομένη στους ωκεανούς του κόσμου. Δημιουργήσαμε την πρώτη εικόνα της διάταξης των γονιδίων του και δείχνουμε ότι μπορεί να περιέχει διαφορετικά σύνολα γονιδίων, κάτι που πιστεύουμε ότι υποδηλώνει ότι αυτός ο ιός εκτελεί διαφορετικές λειτουργίες στο περιβάλλον του.

Αυτά τα προκαταρκτικά αποτελέσματα αντιπροσωπεύουν μόνο δύο από τους χιλιάδες σχολιασμούς που παρείχε η προσέγγισή μας.

Αναλύστε το άγνωστο

Οι περισσότεροι από τους εκατοντάδες χιλιάδες ιούς που ανακαλύφθηκαν πρόσφατα παραμένουν αταξινόμητοι. Πολλές αλληλουχίες ιικών γονιδίων ταιριάζουν με οικογένειες πρωτεϊνών των οποίων οι λειτουργίες δεν είναι γνωστές ή δεν έχουν παρατηρηθεί ποτέ πριν. Η εργασία μας δείχνει ότι παρόμοια μοντέλα γλώσσας πρωτεΐνης θα μπορούσαν να βοηθήσουν στην εξερεύνηση της απειλής και της υπόσχεσης των πολλών αχαρακτήριστων ιών του πλανήτη μας.

Ενώ η μελέτη μας επικεντρώθηκε στους ιούς στους ωκεανούς του κόσμου, ο βελτιωμένος σχολιασμός των ιικών πρωτεϊνών είναι κρίσιμος για την καλύτερη κατανόηση του ρόλου που διαδραματίζουν οι ιοί στην υγεία και τις ασθένειες στο ανθρώπινο σώμα. Εμείς και άλλοι ερευνητές έχουμε υποθέσει ότι η ιική δραστηριότητα στο μικροβίωμα του ανθρώπινου εντέρου μπορεί να μεταβληθεί όταν είστε άρρωστοι. Αυτό σημαίνει ότι οι ιοί μπορούν να βοηθήσουν στην ανίχνευση του στρες στις μικροβιακές κοινότητες.

Ωστόσο, η προσέγγισή μας είναι επίσης περιορισμένη, καθώς απαιτεί σχολιασμούς υψηλής ποιότητας. Οι ερευνητές αναπτύσσουν νεότερα μοντέλα γλώσσας πρωτεΐνης που ενσωματώνουν άλλες «εργασίες» στην εκπαίδευσή τους, ιδιαίτερα την πρόβλεψη της δομής της πρωτεΐνης, για να αναγνωρίσουν παρόμοιες πρωτεΐνες και να τις κάνουν πιο ισχυρές.

Συνολικά, η ανάπτυξη όλων των εργαλείων τεχνητής νοημοσύνης μέσω των αρχών FAIR Data – δεδομένα που είναι ανιχνεύσιμα, προσβάσιμα, διαλειτουργικά και επαναχρησιμοποιήσιμα – μπορεί να βοηθήσει τους ερευνητές να συνειδητοποιήσουν τις δυνατότητες αυτών των νέων μεθόδων για τον σχολιασμό αλληλουχιών πρωτεϊνών, οδηγώντας σε ανακαλύψεις που ωφελούν την ανθρώπινη υγεία.

Αυτό το άρθρο αναδημοσιεύτηκε από το The Conversation, έναν μη κερδοσκοπικό, ανεξάρτητο ειδησεογραφικό οργανισμό που σας φέρνει γεγονότα και αξιόπιστες αναλύσεις για να σας βοηθήσει να κατανοήσετε τον περίπλοκο κόσμο μας. Γράφτηκε από: Libusha Kelly, Albert Einstein College of Medicine

Διαβάστε περισσότερα:

Η Libusha Kelly χρηματοδοτείται από τα Εθνικά Ινστιτούτα Υγείας.

Οι ιοί κάνουν μυστηριώδη πράγματα παντού – Η τεχνητή νοημοσύνη μπορεί να βοηθήσει τους ερευνητές να καταλάβουν τι κάνουν στους ωκεανούς και στο έντερο σας

Σχολιασμός ιών με AI

Αναλύστε το άγνωστο

Leave a Reply Cancel reply