|
Article on other languages:
|
De International Chemical Identifier, afgekort InChI, is een tekstuele identifier voor chemische stoffen, vooral bedoeld om moleculen ondubbelzinnig en op een voor mensen leesbare manier te coderen, waarbij het zoeken naar die stof in databanken en via het web gemakkelijker zou gemaakt worden. InChI werd ontwikkeld tussen 2000 en 2005 door de IUPAC en het NIST. Zowel het formaat als de algoritmen zijn niet-propriëtair en de software is gratis ter beschikking gesteld onder de open source LGPL licentie. De naam InChI is echter wel een handelsmerknaam van de IUPAC.[1]
AlgemeenChemische stoffen worden door InChI beschreven als zes lagen van informatie — de atomen, de bindingen ertussen, tautomerie, isotopen, stereochemie en lading. Niet alle lagen zijn verplicht; informatie over tautomerie hoeft bijvoorbeeld niet toegevoegd te worden indien dit niet van toepassing is op de molecule in kwestie. InChI bevat geen informatie over de driedimensionale coördinaten van de atomen of de bindingsorde. Twee tautomere vormen van dezelfde molecule worden dus door dezelfde InChI beschreven, een pluspunt t.o.v. alternatieven zoals SMILES. InChI's verschillen van CAS nummers in drie aspecten :
InChI's kunnen dus gezien worden als verkorte, geformaliseerde versies van de IUPAC-namen van stoffen. Het InChI algoritme zet structurele informatie om in een unieke InChI-identifier in drie stappen : 1) normalisatie (verwijderen van overtollige informatie), 2) canonicalisatie (genereren van een uniek numeriek label voor elk atoom), 3) serialisatie (genereren van een reeks lettertekens). Formaat en informatielagenElke InChI begint met de tekenreeks "InChI=" gevolgd door het versienummer, op dit moment 1. De resterende informatie is opgevat als een sequentie van lagen en sublagen, waarbij elke laag een specifieke soort informatie weergeeft. Lagen en sublagen worden gescheiden door een delimiter "/" en beginnen met een karakteristieke letter als prefix (dit geldt niet voor de sublaag "brutoformule" binnen de hoofdlaag). De zes lagen met hun meest belangrijke sublagen zijn:
Dit delimiter-prefix formaat heeft als groot voordeel dat men gemakkelijk een wildcard zoekopdracht kan gebruiken om InChI's te vinden die enkel in bepaalde lagen overeenkomen. Voorbeelden
Externe linksZie ook
|
This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.