Podrobno

Knots and $\theta$-curves identification in polymeric chains and native proteins using neural networks
ID da Silva, Fernando Bruno (Avtor), ID Gabrovšek, Boštjan (Avtor), ID Korpacz, Marta (Avtor), ID Luczkiewicz, Kamil (Avtor), ID Niewieczerzal, Szymon (Avtor), ID Sikora, Maciej (Avtor), ID Sulkowska, Joanna I. (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (3,47 MB)
MD5: 43918B104CED420C3C162B307FB6B591
URLURL - Izvorni URL, za dostop obiščite https://pubs.acs.org/doi/10.1021/acs.macromol.3c02479 Povezava se odpre v novem oknu

Izvleček
Entanglement in proteins is a fascinating structural motif that is neither easy to detect via traditional methods nor fully understood. Recent advancements in AI-driven models have predicted that millions of proteins could potentially have a nontrivial topology. Herein, we have shown that long short-term memory (LSTM)-based neural networks (NN) architecture can be applied to detect, classify, and predict entanglement not only in closed polymeric chains but also in polymers and protein-like structures with open knots, actual protein configurations, and also ▫$\theta$▫-curves motifs. The analysis revealed that the LSTM model can predict classes (up to the ▫$6_1$▫ knot) accurately for closed knots and open polymeric chains, resembling real proteins. In the case of open knots formed by protein-like structures, the model displays robust prediction capabilities with an accuracy of 99%. Moreover, the LSTM model with proper features, tested on hundreds of thousands of knotted and unknotted protein structures with different architectures predicted by AlphaFold 2, can distinguish between the trivial and nontrivial topology of the native state of the protein with an accuracy of 93%.

Jezik:Angleški jezik
Ključne besede:machine learning, topology, protein databases, entanglements, open knots, closed knots
Vrsta gradiva:Članek v reviji
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:FS - Fakulteta za strojništvo
FMF - Fakulteta za matematiko in fiziko
Status publikacije:Objavljeno
Različica publikacije:Objavljena publikacija
Leto izida:2024
Št. strani:Str. 4599-4608
Številčenje:Vol. 57, iss. 9
PID:20.500.12556/RUL-166791 Povezava se odpre v novem oknu
UDK:004.85:004.725.4
ISSN pri članku:0024-9297
DOI:10.1021/acs.macromol.3c02479 Povezava se odpre v novem oknu
COBISS.SI-ID:194735875 Povezava se odpre v novem oknu
Datum objave v RUL:24.01.2025
Število ogledov:666
Število prenosov:158
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del revije

Naslov:Macromolecules
Skrajšan naslov:Macromolecules
Založnik:American Chemical Society
ISSN:0024-9297
COBISS.SI-ID:25886464 Povezava se odpre v novem oknu

Licence

Licenca:CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.

Sekundarni jezik

Jezik:Slovenski jezik
Ključne besede:strojno učenje, topologija, proteinska baza podatkov, zavozlanost, odprti vozli, sklenjeni vozli

Projekti

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:N1-0278-2023
Naslov:Biološka koda vozlov - identifikacija vzorcev vozlanja v biomolekulah z uporabo umetne inteligence

Financer:Drugi - Drug financer ali več financerjev
Program financ.:NCN - National Science Centre, Poland
Številka projekta:2021/43/I/NZ1/03341

Financer:Drugi - Drug financer ali več financerjev
Program financ.:NCN - National Science Centre, Poland
Številka projekta:2022/47/B/NZ1/03480

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj