SMILES

Article on other languages:

del.icio.us del.icio.us
Digg Digg
Furl Furl
Reddit Reddit
Rojo Rojo
Add to OnlyWire

SMILES of voluit simplified molecular input line entry specification is een specificatie om de structuur van chemische moleculen op eenduidige wijze te beschrijven als een ASCII alpha-numerieke karakterreeks. SMILES kunnen door de meeste chemische tekenprogramma's ingelezen worden en worden omgezet in een twee dimensionale tekening of een drie dimensionaal model van het molecuul.

De specificatie was ontwikkeld door David Weininger eind jaren 1980. Het is sindsdien door anderen aangepast en uitgebreid. Andere lineaire notaties voor moleculen zijn, onder andere, Wiswesser Line Notation (WLN), ROSDAL en SLN (Tripos Inc).

Definitie

Het molecuul wordt weergegeven in een boomstructuur en de SMILES voor dat molecuul wordt verkregen door de labels van de knopen in de boom op te sommen zoals in een depth-first-search. Een label in de boom is de standaard representatie van het chemische element in rechte haken. De label van goud is dus '[Au]'.

Vertakkingen in de boom worden aangegeven met de haken: '(' en ')'. Wanneer de rechte haken bij een molecuul zijn weggelaten dan zijn de waterstofatomen aan dit molecuul weggelaten, zo kan methaan aangeduid worden met '[C]([H])([H])([H])[H]' en het kortere 'C'. De lading van een atoom wordt weergegeven door een aantal keren '-' of '+' achter het label te plaatsen of door een keer '-' of '+' en dan een numerieke waarde. Zo kan het hydroxide anion gerepresenteerd worden door '[OH-]' en door '[OH-1]'.

Een molecuul kan een of meerdere ringstructuren bevatten. Om deze in een boom te kunnen opslaan, worden de ringen verbroken. Op de plaatsen waar de ringen verbroken worden, worden de labels in de boom uitgebreid met een getal. Gelijke getallen willen zeggen dat er in het molecuul daar een verbinding is. Cyclohexaan wordt gerepresenteerd door 'C1CCCCC1'.

Tussen twee atomen zijn verschillende typen chemische bindingen mogelijk. Het type van de binding wordt opgeslagen in de verbindingen in de boom. Een enkelvoudige binding wordt niet in de SMILES opgenomen, een dubbele binding wordt aangeduid met een '=' en een drievoudige binding met een '#'. Kooldioxide wordt gerepresenteerd door 'O=C=O' en waterstofcyanide door 'HC#N'.

Uitbreidingen

SMARTS is een aanpassing van SMILES die naast de SMILES elementen het gebruik van joker atomen en bindingen toe staat. Dit wordt gebruikt om chemische zoekstructuren te specificeren voor het zoeken in chemische databases.

Een belangrijke verbetering aan SMILES is de uitbreiding om stereo-chemische informatie te kunnen weergeven.

Externe links

 

This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.