Référence : Handbook of chemoinformatics algorithms ( Jean-Loup Faulon, Andreas Bender)

Le domaine de la manipulation électronique de l’information chimique – connu sous le nom d’hémoinformatique ou de Cheminformatics – a reçu un coup de fouet au cours des dernières décennies, en ligne avec l’avènement de l’énorme puissance informatique. Originaire des années 1960 dans les milieux académiques et industriels (et nommé par son nom actuel seulement autour de 1998), les applications hémoinformatiques sont aujourd’hui monnaie courante dans chaque entreprise pharmaceutique.
En outre, divers laboratoires universitaires en Europe, aux États-Unis et en Asie confèrent des diplômes de premier cycle et des cycles supérieurs dans le domaine.
Mais malgré tout, il y a un long chemin à parcourir. Tout en ressemblant à ses frères et soeurs, la bioinformatique, aussi bien par son nom que par voie algorithmique, le champ de la chimio-informatique s’est développé d’une manière très différente dès le début. Alors que de grandes quantités d’informations biologiques – informations sur les séquences, informations structurelles et, plus récemment, informations phénotypiques – telles que les données métabolomiques – tombent directement dans le domaine public, l’information chimique à grande échelle était jusqu’à très récemment le domaine des entreprises privées.

Ainsi, les outils publics pour manipuler les structures chimiques étaient rares depuis très longtemps, alors que les outils bioinformatiques essentiels tels que ceux pour aligner les séquences ou visualiser les structures protéiques étaient disponibles gratuitement pour quiconque s’intéresse à la zone.

Plus récemment, heureusement, cette situation a changé de manière significative, les principaux fournisseurs de données sur les sciences de la vie tels que le NCBI, l’EBI et bien d’autres ayant également rendu publiques des données chimiques à grande échelle.
Cependant, il y a un autre aspect, en dehors des données réelles, qui est crucial pour qu’un domaine scientifique prospère

  • la documentation appropriée des techniques et méthodes
  • dans le cas des sciences informatiques, la documentation appropriée des algorithmes.

Dans le domaine de la bioinformatique, pourvue d’une énorme quantité de données et d’outils disponibles en libre accès, les algorithmes ont été largement documentés dans des ouvrages de référence.
Cependant, dans le domaine de la chimio-informatique, ces types d ‘ouvrages de référence manquent. C’est ce que les éditeurs, avec l’aide d’experts dans le domaine, tentent de corriger – pour donner un aperçu de certains des algorithmes les plus courants de la chimio-informatique dans des ouvrages de référence.

~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Cette partie est divisée en 15 chapitres.
Le chapitre 1 présente une perspective historique des applications des algorithmes et de la théorie des graphes aux problèmes chimiques.
Les algorithmes de stockage et de récupération des structures chimiques bidimensionnelles sont présentés au Chapitre 2, et les représentations tridimensionnelles des produits chimiques sont discutées au Chapitre 3.
Les descripteurs moléculaires, largement utilisés dans le criblage virtuel et les prédictions de structure / activité / propriété, sont présentés dans Chapitre 4.
Le chapitre 5 présente des méthodes de criblage virtuel d’un point de vue de ligand et d’une perspective de structure comprenant des méthodes d’arrimage.
Les chapitres 6 et 7 sont consacrés aux relations quantitatives structure-activité (QSAR). Le workflow de modélisation QSAR et les méthodes de préparation des données sont présentés au chapitre 6, tandis que le développement et la validation des modèles QSAR sont présentés au chapitre 7.
Le chapitre 8 présente des algorithmes pour énumérer et échantillonner les structures chimiques.

Les chapitres 9 et 10 sont consacrés à la conception moléculaire assistée par ordinateur:

  • du point de vue du ligand au chapitre 9, où les méthodes QSAR inverses sont examinées,
  • du point de vue de la structure au chapitre 10, où les algorithmes de conception novo sont présentés.

Le chapitre 11 couvre la génération de réseaux de réaction, avec des applications dans la conception de synthèse et l’inférence de réseaux biologiques.
Pour clore les chapitres strictement liés à la chémoinformatique, le chapitre 12 présente une revue des logiciels Open Source et des technologies de bases de données dédiées au domaine.
Les chapitres restants (13-15) présentent des techniques développées dans le contexte de la bioinformatique et de la biologie computationnelle et leurs applications potentielles à des problèmes chimiques.
Le chapitre 13 traite des applications possibles des algorithmes d’alignement de séquences à des structures arborescentes telles que les glycanes.
Le chapitre 14 présente des algorithmes classiques d’apprentissage automatique qui peuvent être utilisés à la fois pour des problèmes bioinformatiques et des problèmes de chemoinformatique.
Le chapitre 15 introduit une approche de biologie des systèmes pour étudier la cinétique des réseaux métaboliques.