L'utilisation d'un modèle implique une représentation simplifiée d'un système ou d'un processus pour une meilleure compréhension. Les chimistes conçoivent, transforment et étudient des objets bien réels qu'ils ne voient pas. Ils doivent donc continuellement chercher à améliorer les représentations mentales qu'ils se font des atomes ou des molécules. Les modèles qui en découlent sont l'oeuvre d'une patiente accumulation de faits expérimentaux et d'une rigoureuse confrontation de ces observations qui permettent de donner de la réalité invisible une image de plus en plus riche [1]. Ainsi en a-t-il été de la structure hexagonale du benzène de Kekulé ou du carbone tétraédrique de Le Bel et van't Hoff, par exemple.
La chimie assistée par ordinateur (« Computational Chemistry » en anglais) est le domaine de la chimie qui fait intervenir l'ordinateur ; ses applications peuvent être de différente nature, telles que l'élucidation et l'analyse de structures chimiques, le traitement d'informations chimiques ou encore la chimie théorique [1]. Les domaines de la chimie théorique sont, de même, très nombreux : chimie quantique, mécanique moléculaire, dynamique moléculaire ou encore représentation moléculaire.
La chimie quantique tient compte de la structure électronique d'un système et repose sur l'équation de Schrödinger.
L'utilisation de méthodes théoriques pour l'obtention de modèles qui puissent prédire et comprendre les structures, les propriétés et les interactions moléculaires est connue sous le nom de « Modélisation Moléculaire ». Celle-ci permet de fournir des informations qui ne sont pas disponibles par l'expérience et joue donc un rôle complémentaire à celui de la chimie expérimentale. Ainsi, la modélisation moléculaire peut par exemple permettre de se faire une idée précise de la structure de l'état de transition pour une réaction donnée, ce qui est difficile, voire impossible, pour la chimie expérimentale.
Le nombre d'études théoriques a fortement augmenté avec le développement des outils informatiques dans les 20 dernières années : des procédures de calculs numériques ainsi que des ordinateurs toujours plus puissants ont été mis au point, rendant ainsi possible l'étude de systèmes de plus en plus compliqués, et permettant l'utilisation de techniques de calculs et de niveaux de théorie de plus en plus poussés [2].
Comme il va l'être vu, les méthodes de chimie quantique permettent le calcul de la structure électronique de systèmes tels que les atomes, les molécules neutres, les espèces radicalaires, les ions, les clusters d'atomes, les surfaces de solides, etc. Des algorithmes de calculs très précis sont utilisés pour minimiser l'énergie totale en fonction des paramètres structuraux et pour prédire la structure la plus stable des composés étudiés. Les fonctions d'onde ainsi obtenues permettent de calculer des propriétés électriques et magnétiques, de même qu'elles conduisent à l'obtention d'indices de réactivité et d'autres caractéristiques encore. Ces méthodes permettent donc aussi bien l'interprétation de résultats expérimentaux, que la prédiction de propriétés pour lesquelles aucune expérience n'a pu encore fournir d'informations.
Dans cette introduction, il a été choisi de décrire dans le détail la théorie dite de Hartree-Fock pour des raisons historiques, et aussi parce qu'elle est à la base des méthodes qui ont été utilisées dans les études qui vont être présentées ici.
La chimie quantique consiste en l'utilisation de méthodes basées sur la résolution de l'équation de Schrödinger indépendante du temps. En résolvant l'équation aux valeurs propres et vecteurs propres HY = EY, où H est l'hamiltonien non relativiste, E l'énergie totale et Y la fonction d'onde du système, il sera alors possible de déterminer toutes les informations du système étudié.
Il n'est cependant pas possible de résoudre rigoureusement une telle équation, mis à part pour des systèmes mono-électroniques, et des approximations ont donc dû être introduites dans la théorie quantique proposée dés les années 20 afin de pouvoir résoudre cette équation de façon approchée [1-3].
La première approximation, l'approximation de Born-Oppenheimer, permet de séparer le mouvement des électrons de celui des noyaux en se basant sur le fait que les électrons sont beaucoup plus légers et qu'ils bougent donc beaucoup plus rapidement que les noyaux. Les électrons sont ainsi considérés comme se déplaçant dans un champ moyen créé par des noyaux immobiles, et sont donc sujets à un potentiel nucléaire statique. L'équation de Schrödinger à n électrons et à N noyaux peut ainsi être séparée en une partie nucléaire et une partie électronique. Puisque la fonction d'onde nucléaire dépend uniquement des coordonnées des noyaux, la fonction d'onde électronique sera alors calculée pour une position donnée des noyaux et dépendra de paramètres liés aux coordonnées nucléaires.
L'hamiltonien électronique fera intervenir trois termes : l'énergie cinétique des électrons, l'attraction électrostatique des électrons par le champ des noyaux et la répulsion électrostatique entre électrons. Ce dernier terme empêche la séparation de l'équation à n électrons en n équations mono-électroniques et des approximations supplémentaires sont nécessaires sur la fonction d'onde électronique.
L'approximation orbitale suggère d'écrire la fonction d'onde à n électrons comme un produit de n orbitales spatiales à un électron. Cette approximation est valable pour un modèle de particules indépendantes dans lequel la répulsion inter-électronique est omise dans l'hamiltonien. De cette manière l'équation de Schrödinger à n électrons peut se séparer en n équations mono-électroniques. Cependant, la fonction d'onde ainsi obtenue ne satisfait plus le principe de Pauli. Ce problème est alors résolu en écrivant la fonction d'onde comme un déterminant de Slater construit sur la base de n spin-orbitales (où n/2 orbitales spatiales sont combinées à deux fonctions de spin possibles). Le problème réside alors dans l'obtention des meilleures spin-orbitales pour obtenir la fonction d'onde du système à n électrons.
La fonction d'onde ainsi obtenue pour le système à n électrons correspond à un modèle de particules non interagissantes, c'est à dire que le terme de répulsion inter-électronique de l'hamiltonien électronique est négligé. Cette contribution à l'énergie totale du système n'étant pas faible, ce terme doit donc être pris en compte.
Une première approche est celle qui considère un champ électronique moyen, c'est à dire que chaque électron se déplace dans un potentiel créé par les noyaux immobiles et par les n-1 électrons restants. L'hamiltonien consiste alors en deux termes mono-électroniques : l'énergie cinétique et l'énergie d'attraction électrons-noyaux, et deux autres termes bi-électroniques : les termes d'énergie appelés de Coulomb et d'échange. Il est alors possible d'évaluer la meilleure fonction d'onde polyélectronique construite sur la base d'un déterminant de Slater en minimisant l'énergie électronique à l'aide de la méthode variationnelle. Les meilleures fonctions d'ondes seront celles conduisant à l'énergie la plus basse, mais cette énergie sera toujours plus élevée que la valeur exacte car une somme de produits de termes mono-électroniques ne peut pas être une solution exacte d'une équation différentielle contenant des opérateurs bi-électroniques.
La minimisation de l'énergie est effectuée par la méthode SCF (Self Consistent Field) à l'aide des équations de Hartree-Fock mono-électroniques obtenues sous la condition d'énergie minimale, tout en respectant la contrainte d'orthonormalité des orbitales.
La méthode de Hartree-Fock (HF) est donc l'application du principe variationnel à la minimisation de l'énergie avec utilisation de fonctions d'onde construites sur la base d'un déterminant de Slater. Les équations de HF peuvent donc être considérées comme étant des équations de Schrödinger décrivant un électron se déplaçant dans un potentiel moyen créé par les noyaux et les autres électrons restant. Les valeurs propres seront les énergies mono-électroniques associées aux fonctions d'ondes qui correspondent dans ce cas à des orbitales. Cependant, ces équations ne sont pas réellement de type valeurs propres / vecteurs propres car les fonctions sont développées sur une base de dimension finie.
Une solution numérique des équations de HF conduisant à l'obtention d'orbitales atomiques est possible pour les atomes à cause de leur symétrie sphérique (le champ de potentiel étant considéré comme sphérique) ; cependant sa résolution pour des systèmes polyatomiques requiert des développements supplémentaires.
La méthode proposée par Roothaan et Hall en 1951 basée sur l'approximation LCAO (Linear Combination of Atomic Orbitals) de Mulliken développe les orbitales moléculaires en termes de combinaisons linéaires d'orbitales atomiques. Les orbitales atomiques utilisées pour l'expansion des orbitales moléculaires constituent les fonctions de base (Basis Set) choisies pour la description du système. Plus le set de fonctions choisi est grand, plus les orbitales moléculaires se rapprocheront de celles qui seraient obtenues si les équations de HF étaient résolues rigoureusement, ce qui est connu comme étant la limite Hartree-Fock.
Dans la méthode de Roothaan, les équations intégro-différentielles de Hartree-Fock sont converties en un set d'équations algébriques résolues par des méthodes matricielles standard, très commodes pour le traitement informatique. Le problème principal dans l'implémentation de la méthode est le calcul des intégrales bi-électroniques à cause de leur très grand nombre créant des problèmes de stockage dans la mémoire des ordinateurs. Le développement de méthodes numériques comme « SCF direct » calculant les intégrales en temps réel à la place de les stocker dans la mémoire de l'ordinateur a cependant permis d'étendre l'utilisation de cette méthode de calculs (allongeant néanmoins les temps de calculs de manière importante).
Le fait que la corrélation électronique (ou répulsion inter-électronique instantanée) est négligée dans la méthode HF constitue son plus grand handicap. L'énergie de corrélation peut être définie comme étant la différence entre l'énergie non-relativiste exacte et l'énergie HF (à la limite HF). Les effets de la corrélation électronique peuvent être subdivisés en deux catégories : la corrélation dynamique et la corrélation statique. La corrélation dynamique (short-range correlation) se réfère à la corrélation entre le mouvement des électrons provenant de la répulsion interélectronique de Coulomb. La méthode SCF, dans laquelle les répulsions interélectroniques sont effectivement moyennées ignore cet effet. La corrélation non dynamique (long-range correlation) se réfère aux autres déficiences de la fonction d'onde telle que l'incapacité à décrire la dissociation moléculaire, par exemple.
Les méthodes de chimie quantique peuvent être classées sur la base du traitement des intégrales de répulsion interélectronique : méthodes dites « ab initio » (c'est-à-dire basées sur les premiers principes, non empiriques), et méthodes semi-empiriques. Dans les méthodes ab initio les intégrales sont évaluées rigoureusement et tous les électrons sont, en principe, pris en compte (voir plus loin). Dans la seconde catégorie de méthodes, une grande partie de ces intégrales est négligée, simplifiée ou approchée en corrélant les résultats à des données expérimentales. De plus, certains des électrons ne sont pas explicitement pris en considération et généralement seuls les électrons de valence, ou même les électrons p (méthodes de Hückel), sont impliqués dans ce type de calculs.
Une seconde classification possible se fonde sur le traitement de la corrélation électronique. La méthode HF non corrélée peut être améliorée par des traitements appelés post-Hartree Fock comme l'interaction de configuration (CI), la multi-configuration SCF (MC-SCF), la théorie de perturbation Many-Body (MBPT) et la méthode Coupled-Cluster (CC). De plus, une alternative de choix pour l'ajout de la corrélation électronique est l'utilisation de méthodes basées sur la théorie de la fonctionnelle de la densité (comme il sera décrit plus loin).
Les méthodes citées ci-dessus constituent une première approche du traitement de la corrélation électronique. La méthode CI est basée sur l'expansion de la fonction d'onde moléculaire à n électrons comme une combinaison linéaire de déterminants de Slater correspondant à l'état fondamental électronique du système et à différents états excités résultant de la promotion d'électrons d'orbitales occupées vers des orbitales virtuelles. La méthode variationnelle est alors utilisée pour obtenir les coefficients de l'expansion et, dans les faits, si le set de fonctions utilisé était complet, les énergies exactes de tous les états du système pourraient alors être obtenues. La méthode CI permet donc, en principe, d'obtenir une solution exacte pour les problèmes à plusieurs électrons. Dans la pratique, seul un nombre fini de déterminants de Slater peut être traité et le CI ne permet que d'améliorer l'énergie, sans conduire à l'énergie exacte du système. D'autre part, la troncation du set de fonctions peut résulter en une auto-incohérence, et les temps de calculs couplés avec les problèmes de convergence dus à la taille des bases utilisées font que les méthodes CI ne sont pas d'une utilisation très aisée. Ces méthodes permettent néanmoins un traitement de la corrélation non dynamique satisfaisant [4].
Les méthodes MC-SCF font intervenir une fonction d'onde moléculaire à n électrons analogue à celle des méthodes CI ; cependant, ces méthodes optimisent simultanément les coefficients utilisés pour l'expansion de la fonction d'onde à n électrons ainsi que ceux intervenant dans l'expansion des fonctions de base formant les orbitales moléculaires.
Le troisième type de méthode permettant la prise en compte de la corrélation électronique est la méthode MBPT principalement utilisée dans le formalisme de Møller-Plesset [5]. Par opposition à la méthode CI, MBPT ne suit pas le principe variationnel. Dans ce formalisme, l'hamiltonien total est représenté par la somme de deux termes : l'hamiltonien d'ordre zéro et un ou plusieurs termes de perturbation ajoutés à celui-ci. Dans la théorie perturbationnelle, la fonction d'onde et l'énergie pour un état donné sont toutes deux construites sur la base d'expansions de termes d'ordre zéro plus des corrections successives résultant des différents ordres de perturbation choisis pour le traitement du système. Ces méthodes sont beaucoup moins coûteuses en termes de temps de calculs et sont très utilisées. Les plus populaires sont les méthodes dénommées MP2 et MP4 (second- and fourth-order Møller-Plesset Perturbation Theory).
Enfin, la méthode coupled-cluster (CC) est basée sur l'expression de la fonction d'onde à n électrons comme une combinaison linéaire de déterminants de Slater incluant la fonction d'onde HF de l'état fondamental et toutes les excitations possibles des orbitales occupées vers les orbitales virtuelles. Ceci est rendu possible à l'aide d'un opérateur défini par une expansion en série de Taylor, appelé « cluster operator » écrit à son tour en une somme de n opérateurs (pour un système à n électrons). Ces opérateurs sont dénommés opérateurs d'excitation de une-, deux-, ..., n-particules et conduisent à toutes les excitations possibles du système en agissant sur le déterminant de Slater de l'état fondamental. De manière analogue à la méthode CI, la base de fonctions ainsi que la série d'opérateurs sont tronqués, ce qui conduit à différents niveaux de calculs : CCD, CCSD, CCSDT (où S, D, T signifient respectivement simple, double ou triple excitation). Les calculs de type CC sont très coûteux en temps et ne sont donc généralement utilisés que pour des molécules de taille moyenne.
La théorie de la fonctionnelle de la densité propose quant à elle une approche totalement différente du traitement de la corrélation électronique. Les méthodes de DFT ont acquis une popularité grandissante dans les dernières années, et elles constituent une alternative de choix aux méthodes ab initio présentées précédemment. Les théorèmes de Hohenberg et Kohn sont à la base des méthodes de DFT [6]. Celles-ci utilisent la densité électronique en lieu et place de la fonction d'onde à n électrons comme variable du système ; l'énergie y apparaît donc comme étant une fonctionnelle (une fonction de fonction) de la densité électronique et s'écrit E[r].
Ceci permet la substitution de la fonction d'onde polyélectronique compliquée Y(r1, r2, ..., rn) et son équation de Schrödinger associée, HY = EY, par la densité électronique, de forme plus simple, r(r) et son mode de calcul associé. Hohenberg et Kohn ont montré en 1964 [6] que l'énergie fondamentale d'un système polyélectronique E0 et toutes les autres propriétés sont complètement et uniquement déterminées par sa densité électronique, celle-ci étant une fonction à trois variables. Ces auteurs ont aussi montré que la fonctionnelle d'énergie, E0[r] satisfait le principe variationnel, c'est-à-dire que lorsque l'énergie est minimum on a le vrai état fondamental du système.
La forme explicite de la dépendance fonctionnelle de l'énergie avec la densité électronique du système reste cependant de nature inconnue, et le théorème de Hohenberg et Kohn ne dit rien quant à la manière de calculer E0 à partir de r ou comment obtenir r sans préalablement trouver la fonction Y. A l'heure actuelle encore, il n'existe aucune procédure rigoureuse permettant de dériver exactement E0 de la densité r et des approximations sont donc nécessaires.
Il reste à noter que l'énergie de corrélation électronique est prise en compte par le terme de l'hamiltonien appelé d'échange et de corrélation. L'implémentation pratique de cette méthode passe, comme il va l'être décrit au chapitre suivant, par l'obtention d'un set d'équations analogues aux équations de Hartree-Fock, les équations obtenues grâce aux travaux de Kohn-Sham (KS) en 1965 [7], qui conduisent aux orbitales de Kohn-Sham impliquées dans le calcul de la densité électronique. Dans ce cas aussi, une procédure SCF est utilisée.
Les méthodes basées sur l'approche Hartree-Fock ainsi que les méthodes basées sur la théorie de la fonctionnelle de la densité vont être décrites d'un point de vue plus mathématique dans le chapitre suivant. Il faut encore ici noter que les méthodes de calculs basées sur la théorie des orbitales moléculaires (MO) utilisant l'approximation LCAO-MO formulée par Roothaan pour résoudre les équations de Hartree-Fock font intervenir un très grand nombre d'intégrales de répulsion électronique multicentriques. Leur nombre est proportionnel à N4, où N est le nombre d'orbitales atomiques présentes dans la base utilisée. La méthode de Roothaan étant, de plus, auto-cohérente, elle sera résolue de manière itérative, ce qui va accroître l'effort computationnel. Bien que les calculs basés sur la théorie de la fonctionnelle de la densité soient aussi résolus à l'aide de procédures SCF, l'utilisation de la densité électronique comme variable du système et des équations mono-électroniques de Kohn-Sham (HF-like equations) rendent les calculs DFT beaucoup plus rapides que les calculs HF (pour des molécules de taille comparable). De plus, pour le même degré de précision, les méthodes DFT font intervenir un nombre d'intégrales de répulsion interélectronique variant beaucoup plus lentement avec la taille N du système et peuvent donc être appliquées à des systèmes plus gros. Enfin, détail fondamental, les méthodes de DFT tiennent compte de manière intrinsèque de la corrélation électronique.
En résumé, toutes ces méthodes demandent des temps de calculs très variables, et leur choix dépendra du niveau de précision souhaité, ainsi que de la taille du système. Les ordinateurs ont fait, il est vrai, d'énormes progrès ces dernières années, mais certains calculs sont, à l'heure actuelle encore, prohibitifs pour des systèmes contenant un très grand nombre d'atomes comme les protéines, par exemple.
Le travail présenté dans les pages de ce manuscrit est composé de deux parties distinctes.
Après une partie concernant les méthodes de calculs théoriques à proprement parler, les résultats obtenus en tout début du travail de thèse dans le cadre d'une collaboration avec le groupe du Professeur Albert Renken de l'EPFL de Lausanne sont présentés. Cette partie concerne la méthylation catalytique hétérogène en phase gazeuse du catéchol par le méthanol, et ne se veut être qu'une brève présentation des possibilités restreintes de modélisation d'adsorption sur des surfaces qui existaient dans la seconde partie des années 90. Dans cette étude, il a été tenté de décrire le mode d'adsorption du méthanol sur une surface de g-alumine, et pour ce faire, il a été choisi d'utiliser la méthode du cluster d'atomes enrobé de charges ponctuelles.
Les programmes de calculs ont fait d'énormes progrès depuis la publication de cette étude, mais le problème de la modélisation de l'adsorption sur des surfaces reste aujourd'hui encore d'une difficulté non négligeable à cause du choix du modèle (cluster d'atomes, modèle de surface), ou de la méthode de calculs à utiliser.
La seconde partie de cet exposé concerne l'étude mécanistique de l'échange de molécules d'eau dans des complexes hexaaquo de métaux tels que le rhodium(III) et l'iridium(III). Elle a été faite en collaboration avec le groupe du Professeur Merbach de l'EPFL, et constitue la partie la plus consistante du travail de thèse. Afin d'étudier et comprendre les mécanismes d'échange d'eau dans les hexaaqua ions Rh(III) et Ir(III), les chemins réactionnels ont été investigués en phase gazeuse et en phase solvatée à l'aide de différentes techniques et niveaux de calcul. Plusieurs méthodes d'évaluation du volume moléculaire ont été utilisées afin d'essayer de reproduire les résultats expérimentaux.
L'étude publiée sur l'échange d'eau dans l'hexa-aqua ion de rhodium(III) a permis d'atteindre un objectif non négligeable : celui de confirmer le volume d'activation comme l'outil de référence pour l'attribution des mécanismes d'échange et de substitution de ligands. L'étude théorique sur l'aqua-ion analogue de l'iridium(III) a permis de confirmer que le modèle utilisé permet de conduire à des résultats fiables, tout en impliquant des approximations importantes.
Ces deux parties ont donné lieu à diverses présentations publiques, ainsi qu'à trois publications, dont les références sont indiquées ci-après :
"Theoretical Study of the adsorption of methanol on a (110) surface of g-alumina", International IUPAC Congress 1997 "Theoretical Study of the adsorption of methanol on a (110) surface of g-alumina", General Assembly of the Swiss Chemical Society 1997 "Theoretical investigation of the mechanism of water exchange in the rhodium(III) hexaaqua ions: preliminary results", General Assembly of the Swiss Chemical Society 1998 De Vito, D.; Gilardoni, F.; Kiwi-Minsker, L.; Morgantini, P.Y.; Porchet, S.; Renken, A.; Weber, J. Journal of Molecular Structure, Theochem 1999, 469, 7-14 "Can octahedral t2g6 complexes substitute associatively ? The case of the isoelectronic ruthenium(II) and rhodium(III) hexaaquaions", General Assembly of the Swiss Chemical Society 2000 De Vito, D.; Sidorenkova, H.; Rotzinger, F.P.; Weber, J.; Merbach, A.E. Inorg. Chem. 2000, 39, 5547-5552 De Vito, D.; Weber, J.; Merbach, A.E. à soumettre à Inorg. Chem., 2003 |
Toute l'information que l'on peut obtenir sur un système constitué d'un ensemble de particules est contenue dans la fonction d'onde Y du système. La fonction d'onde d'un système composé de N atomes et 2n électrons est obtenue en résolvant l'équation de Schrödinger indépendante du temps suivante [1] :
HY = EY (1)
où E est l'énergie du système et H est l'opérateur correspondant : l'hamiltonien du système. Y est la fonction d'onde du système, fonction des coordonnées des noyaux, des électrons et contient toute l'information du système, E est l'énergie totale. Les valeurs propres de H sont les valeurs observables de cette énergie et les fonctions d'onde correspondantes sont les fonctions propres associées.
Comme il l'a été dit au chapitre I, les propriétés moléculaires qui peuvent être calculées par la résolution de l'équation de Schrödinger sont la géométrie moléculaire, et donc les stabilités relatives, les spectres de vibrations, les moments dipolaires et quadripolaires, les spectres électroniques et aussi des fonctions descriptives de la réactivité, telles que les charges atomiques et les fonctions de Fukui. Toutefois, la précision avec laquelle on peut espérer calculer ces quantités est très variable en fonction de la nature de ces propriétés. Cette équation ne peut en effet pas être résolue de manière exacte pour les systèmes moléculaires, et l'on doit donc effectuer un certain nombre d'approximations.
Pour un système traité comme étant composé de charges ponctuelles (2n électrons et N noyaux), sans traitement relativiste, l'hamiltonien pour un système à couches fermées est donné par :
est la constante de Planck h divisée par 2p, me est la masse de l'électron, e est la charge de l'électron, MA est la masse du noyau A, rkA est la distance entre l'électron k et le noyau A, RAB est la distance entre les noyaux de l'atome A et de l'atome B dont les charges nucléaires sont respectivement ZA et ZB. est le laplacien du kième électron défini de la manière suivante :
Cet hamiltonien ne prend pas en considération les interactions entre les électrons et des champs extérieurs au système (par exemple RPE) ou entre les électrons et les spins nucléaires (par exemple RMN) ; elle est indépendante du temps.
On constate que l'équation de Schrödinger, basée sur cet hamiltonien, est difficilement applicable à des molécules polyatomiques ; on doit donc introduire des approximations telles que l'approximation de Born-Oppenheimer et l'approximation orbitale pour la résoudre.
On utilisera par la suite les notations en unité atomiques. Dans ce système d'unités me = 1 ; = 1, e = 1 et 4peo = 1. On assumera d'autre part que le système étudié est à couches fermées.
Grâce à l'utilisation des unités atomiques, l'hamiltonien se simplifie sous la forme :
En 1927, Born et Oppenheimer ont proposé de simplifier la résolution de l'équation (1) en séparant la partie électronique de la partie nucléaire dans la fonction d'onde Y. Cette approximation est basée sur le fait que les électrons se déplacent beaucoup plus rapidement que les noyaux, ceci étant dû à la masse beaucoup plus faible des électrons (environ 1836 fois moindre de celle du proton). Par conséquent, les électrons réagissent quasi instantanément à une modification de la position des noyaux [2].
En d'autres termes, pour une conformation R donnée des noyaux, seule la contribution électronique e(R) à l'énergie totale E est nécessaire pour connaître les propriétés du système. Cela revient donc à résoudre deux équations du type Schrödinger, l'une pour la partie nucléaire et l'autre pour la partie électronique. La fonction d'onde du système, solution de l'équation de Schrödinger dans l'approximation de Born et Oppenheimer, peut donc s'écrire sous la forme d'un produit de deux fonctions :
où F(R) est la fonction d'onde nucléaire, YR(r) est la fonction d'onde électronique correspondant à un jeu de positions R des noyaux figés, r et R étant respectivement les positions des électrons et des noyaux.
En écrivant l'hamiltonien H sous la forme :
où V(r,R) est un potentiel dépendant de la position des électrons et des noyaux, on fait apparaître un opérateur électronique He(r;R) de la forme :
On peut montrer, moyennant certaines approximations, que si l'on remplace l'expression (2) dans l'équation de Schrödinger, on obtient :
la fonction d'onde Ye(r) est une fonction propre de l'opérateur électronique He avec la valeur propre e(R), pour des positions R des noyaux figées. En résolvant l'équation (3) pour plusieurs positions successives des noyaux, on obtient alors une fonction de R :
qui représente l'énergie Born-Oppenheimer du système en fonction des positions R des noyaux immobiles.
Born et Oppenheimer ont aussi montré que le mouvement des atomes est régi par une équation de type Schrödinger où le potentiel dépend de l'énergie électronique évaluée par l'équation (3) :
U(R) joue donc le rôle d'une énergie potentielle pour le mouvement des noyaux. L'ensemble des conformations R des atomes permet alors de construire une surface d'énergie potentielle appelée « surface de Born-Oppenheimer (BO) ». Il s'agira d'une fonction à 3N-6 variables (3N-5 pour les molécules linaires) dont les minima correspondent aux géométries stables de la molécule. Au minimum de plus basse énergie correspond la géométrie à l'équilibre de la molécule. La détermination de U(R) et de ses dérivées première et seconde permet de localiser des points stationnaires sur la surface de BO et, par conséquent, d'élaborer des chemins réactionnels. Elle donne aussi accès aux constantes de force des molécules et donc aux fréquences de vibrations, de même que peuvent être calculées des propriétés telles que le moment dipolaire, la polarisabilité, etc.
Pour la résolution de la partie électronique, en considérant que le comportement des électrons n'est pratiquement pas modifié par les faibles déplacements des noyaux que l'on suppose comme étant figés dans leur position instantanée, l'hamiltonien dans l'approximation de Born-Oppenheimer se limite aux composantes électroniques seules :
On remarque cependant que le dernier terme est un opérateur biélectronique alors que les deux premiers sont monoélectroniques, ce qui pose une difficulté ultérieure pour le traitement de la fonction Ye.
La fonction d'onde électronique Ye (que nous désignerons dorénavant uniquement par la lettre Y) est une fonction des coordonnées de tous les électrons du système. Si 2n est le nombre d'électrons (2n est choisi ici par comodité), Y est une fonction à (2n)×3 variables que l'on note communément Y(1,2,... 2n).
L'approximation orbitale, introduite par Hartree en 1928 [3], consiste à découpler les 2n électrons en développant la fonction Y(1,2,...,2n) en un produit de 2n fonctions monoélectroniques, de sorte que :
où l'indice i désigne l'orbitale i
Cette situation correspond physiquement à un modèle de particules indépendantes dans lequel chaque électron se déplace dans un champ moyen créé par les noyaux et la densité électronique moyenne des autres électrons. Cela signifie que chaque électron ressent les autres en moyenne, ce qui constitue naturellement une approximation.
La fonction d'onde n'a cependant pas de terme décrivant le spin car celui-ci est absent de l'hamiltonien électronique. Pour décrire complètement la distribution des électrons, la coordonnée de spin s doit donc être introduite, et celle-ci prendra les valeurs +1/2 ou -1/2. Le spin est une propriété intrinsèque de l'électron, de nature purement quantique, et n'a donc pas d'équivalent en mécanique classique. La fonction d'onde de spin pour le spin aligné le long de l'axe (+)z sera a(s) et celle pour le spin aligné le long de (-)z sera b(s).
La fonction d'onde électronique est donc composée d'une partie spatiale, l'orbitale, et d'une partie de spin. La fonction f est ce que l'on appelle une spin-orbitale et on l'écrit :
f(r,s) = c(r)h(s)
où r et s sont les coordonnées d'espace et de spin, respectivement.
Pour un système à 2n électrons la fonction d'onde polyélectronique Y la plus simple s'écrira donc sous la forme d'un produit de spin-orbitales supposées normalisées :
La fonction d'onde représentée par l'équation ci-dessus n'est cependant pas encore complète, car elle ne prend pas en compte l'indiscernabilité des électrons, ni le principe d'exlusion de Pauli [4]. Celui-ci a montré que pour les fermions (particules à spin ½), une spin-orbitale doit être antisymétrique par rapport à la permutation impaire des coordonnées d'espace et de spin. En permutant deux électrons il vient, par exemple :
Une telle fonction obéit au principe d'exclusion de Pauli qui impose à deux électrons de ne pas pouvoir occuper la même spin-orbitale, ainsi qu'à l'indiscernabilité des électrons. Or, dans la formulation de Hartree de la fonction d'onde, cela n'est pas le cas, car l'électron i occupe précisément la spin-orbitale i.
Hartree et Fock ont généralisé ce concept en montrant que le principe d'exclusion de Pauli est respecté si l'on écrit la fonction d'onde sous la forme d'un déterminant construit à partir de n spin-orbitales [5] ; on obtient alors ce qui est connu sous le nom de « déterminant de Slater » :
Les variables xi représentent ici les coordonnées d'espace et de spin. est le facteur de normalisation ; 2n étant le nombre d'électrons.
On constate que la forme déterminantale de la fonction d'onde respecte le principe de Pauli : l'inversion de deux électrons correspond à la permutation de deux lignes (ou de deux colonnes), ce qui a pour effet de changer le signe du déterminant. Les spin-orbitales fi doivent, d'autre part, être différentes les unes des autres, car dans le cas contraire, le déterminant (6) s'annule.
Le problème consiste dés lors à rechercher les meilleures spin-orbitales conférant l'énergie la plus basse possible au système, conformément au principe variationnel ; ce but est atteint un utilisant la méthode auto-cohérente de Hartee-Fock.
Après avoir défini la forme de la fonction d'onde électronique globale d'un système polyélectronique à 2n électrons, il nous faut encore trouver l'expression de l'énergie électronique de ce système. D'autre part il nous reste à déterminer comment on peut obtenir les orbitales spatiales fi servant à construire le déterminant de Slater ; celles-ci étant des orbitales moléculaires (construites sur une base de fonctions qui reste à déterminer) dans le cas des systèmes polyatomiques. L'énergie moyenne du système s'obtient aisément après quelques manipulations mathématiques sur l'expression générale (3) en utilisant une fonction d'onde Y de la forme Slater. On obtient alors une expression pour l'énergie électronique moyenne (où l'on somme sur les n orbitales électroniques) :
où :
Dans l'expression ci-dessus, le terme Hii représente l'énergie d'un électron situé dans une orbitale moléculaire fi placé dans le champ des noyaux ; ce terme est multiplié par deux car il y a 2 électrons par orbitales (pour un système à « couches fermées »).
Les intégrales Jij et Kij sont respectivement appelées intégrales de Coulomb et intégrales d'échange ; l'intégrale de Coulomb a un équivalent en mécanique classique, alors que l'intégrale d'échange provient de la nécessité d'antisymétriser la fonction d'onde. Les intégrales de Coulomb et d'échange décrivent les interactions entre électrons. Jij représente l'interaction coulombienne moyenne entre deux électrons situés dans les orbitales fi et fj, sans tenir compte de leur spin. L'intégrale d'échange Kij réduit l'intéraction coulombienne entre deux électrons situés dans les orbitales fi et fj ayant des spins parallèles. Ce terme est une conséquence directe du principe de Pauli et conduit à une valeur d'énergie Ee plus basse, donc à une stabilisation. Par l'intermédiaire de l'intégrale d'échange on introduit ainsi une corrélation électronique entre électrons ayant des spins parallèles, c'est-à-dire que deux tels électrons ne peuvent pas se mouvoir indépendamment l'un de l'autre. On constate toutefois que ce modèle n'est pas apte à rendre compte de la corrélation entre électrons ayant des spins antiparallèles.
Nous nous proposons maintenant de résoudre l'équation de Schrödinger électronique (3) avec une fonction d'onde Y qui a la forme d'un déterminant de Slater afin de trouver l'expression des fonctions fi. Il est évident que ce déterminant ne peut pas être une solution exacte de l'équation de Schrödinger car une somme de termes monoélectroniques ne peut jamais être la solution d'une équation différentielle contenant des opérateurs biélectroniques. On doit, par conséquent, utiliser le principe variationnel [6].
En utilisant cette idée, Fock et Slater ont développé de façon simultanée et indépendante ce qui est maintenant connu sous le nom d'équations de Hartree-Fock [7]. Le principe variationnel dit qu'étant donnée une fonction d'onde d'essai de la forme d'un déterminant de Slater, on peut montrer que l'on a toujours :
où E0 est l'énergie de la solution exacte . La « meilleure » fonction d'onde de type déterminant de Slater sera donc obtenue en faisant varier tous les paramètres qu'elle contient, jusqu'à ce que l'on obtienne l'énergie la plus basse. Cela revient à minimiser la quantité . En se rappelant qu'au cours de la minimisation, la fonction d'essai doit respecter la condition de normation , le problème revient alors à faire une minimisation avec contrainte que l'on résout par la méthode des « multiplicateurs de Lagrange ».
Soit une fonction G dépendante de plusieurs fonctions inconnues telle que :
où Sij provient de la condition d'orthonormalité :
eij sont les multiplicateurs de Lagrange supposés réels
On a alors :
et on obtiendra les points stationnaires de la fonction G, au premier odre, en résolvant l'équation :
dG = 0
La variation infinitésimale dG est obtenue en faisant varier d'une quantité infinitésimale chaque orbitale fi, ce qui revient à remplacer fi par fi+dfi et fj par fj+dfj. On aura alors :
Après quelques manipulations mathématiques, il est possible de se ramener à un système d'équations différentielles, les « équations de Hartree-Fock » :
avec :
h(1) est l'opérateur qui prend en compte l'énergie cinétique de l'électron 1 et son énergie potentielle d'interaction avec le noyau A. Les termes J et K ont été définis précédemment. Il faut encore noter que l'opérateur K est non-local car, comme le montre l'expression ci-dessus, il dépend de la valeur de f(1) sur tout l'espace.
On constate ici que les opérateurs J et K s'expriment en fonction des solutions f de l'équation (8). On se trouve donc en présence d'un ensemble de N équations monoélectroniques non linéaires qu'il faudra résoudre par un processus itératif : à partir d'un jeu de spin-orbitales fi d'essai on calcule l'opérateur
pour en déduire ensuite un nouveau jeu de fonctions fi. Ce processus est nommé auto-cohérent.
Il est possible de montrer qu'il existe une transformation orthogonale des fi amenant la matrice des multiplicateurs de Lagrande eij à sa forme diagonale. En appliquant cette transformation à nos orbitales fi, on est apparemment conduit à un problème de valeurs propres puisque les équations (8) s'écrivent alors sous la forme :
Ici ei est l'énergie de l'orbitale i et F est l'opérateur monoélectronique de Fock donné par :
Ce système d'équations ne prend en compte que les orbitales spatiales fi. La seule référence au spin est faite lors du remplissage des orbitales où deux électrons seront placés par orbitale spatiale (principe de complémentarité appelé « aufbau »).
Les équations de Hartree-Fock sont un jeu d'équations intégro-différentielles couplées, et ne peuvent être résolues que par une méthode itérative. Le couplage se constate par le fait que les intégrales Jij et Kij sont définies en fonction des orbitales fi et fj, ce qui veut dire que pour déterminer F(1) dans (10) on a besoin de connaître les autres orbitales fj.
Pour résoudre ces équations, un jeu d'orbitales d'essai est donc choisi : l'opérateur de Fock est ensuite construit et le système d'équations (9) est résolu de façon à obtenir un nouveau jeu d'orbitales. Cette procédure est appelée « méthode à champ auto cohérent » (SCF = Self Consistent Field), car les itérations sont continuées jusqu'à ce que le champ électrostatique ressenti par un électron (champ provoqué par les autres électrons dans les autres orbitales) reste stationnaire.
Ces équations peuvent s'interpréter comme étant des équations de Schrödinger pour des électrons évoluant dans le champ des noyaux et des autres électrons du système, et dont les valeurs propres sont les énergies monoélectroniques ei associées aux fonctions propres, les spin-orbitales. Il reste maintenant à expliciter la forme des spin-orbitales fi pour résoudre les équations de Hartree-Fock.
Nous avons vu que les orbitales moléculaires optimales s'obtiennent en résolvant un ensemble d'équations différentielles non linéaires (ne pouvant être résolues rigoureusement que pour des atomes dans l'hypothèse d'une distribution électronique globale sphérique). Cette technique conduit à une tabulation des orbitales, ce qui les rend inadéquates pour un bon nombre d'applications. Si l'on désire obtenir des spin-orbitales moléculaires sous une forme analytique, on doit se résigner à résoudre de manière approchée les équations de Hartree-Fock en choisissant pour orbitales moléculaires des combinaisons linéaires d'orbitales atomiques.
L'approximation LCAO proposée par Mulliken en 1941 [8] consiste à construire un jeu limité d'orbitales atomiques (OA) cm qui constituera une base sur laquelle seront développées les orbitales moléculaires fi (seule la partie spatiale des spin-orbitales est considérée ici). En essayant de résoudre les équations de Hartree-Fock pour des molécules, Hall, et indépendamment Roothaan, ont démontré qu'en introduisant un jeu de fonctions spatiales connues, les équations intégro-différentielles peuvent alors être transformées en un système d'équations algébriques et ainsi être résolues en utilisant la méthode habituelle des matrices [9]. Les nouvelles équations que l'on obtient dans cette approximation sont les équations de Hartree-Fock-Roothan.
Si l'on considère un ensemble de m orbitales atomiques (cl,cm,cn,cr, ...) servant de base au développement des m orbitales moléculaires fi(r) d'un système à couches fermées comportant 2n électrons, les orbitales moléculaires seront exprimées comme une combinaison linéaire de ces m fonctions spatiales mono-électroniques atomiques :
Les cmi sont les coefficients des orbitales moléculaires développées sur les fonctions de base. En toute rigueur le développement devrait être infini. Dans la pratique, il est clairement impossible de construire une base infinie d'orbitales. Par convention les OA sont centrées sur les atomes (d'où leur nom) et le symbole m correspond à l'atome sur lequel se trouve l'orbitale c. Il faut encore remarquer que malgré le terme « d'orbitales atomiques », celles-ci ne sont pas toujours les orbitales auto-cohérentes de l'atome isolé. Par cette méthode, les orbitales fi sont délocalisées sur l'ensemble de la molécule et pour cette raison elles s'appelleront « orbitales moléculaires ». La terminologie généralement admise pour désigner des orbitales moléculaires (OM) obtenues par l'optimisation des coefficients des fonctions de base atomiques qui sont des combinaison linéaires d'orbitales atomiques (LCAO) est LCAO-MO. Les orbitales moléculaires doivent, en outre, respecter les conditions de normation et d'othogonalité mutuelle que l'on écrit :
où dij est le symbole de Kronecker et Smn est communément appelée intégrale de recouvrement des orbitales cm et cn, et s'écrit :
Ce développement, appliqué aux équations de Hartree-Fock, conduit aux équations de Hartree-Fock-Roothan auxquelles on applique une fois encore le principe variationnel : on minimise l'énergie totale e par rapport aux coefficients du développement et l'on obtient alors les équations :
i = 1,2,...m étant les coefficients des orbitales moléculaires, et m = 1,2,...,m étant les coefficients des orbitales atomiques. On aura les termes suivants :
et est la matrice de population pour ce système à couches fermées.
Le choix de la base constituée par les orbitales atomiques cm est fondamental, car il joue un rôle important, tant sur la précision des résultats, que sur les temps de calculs nécessaires pour les obtenir, comme il sera vu plus loin dans ce chapitre.
La résolution de ce système d'équations passe par l'annulation d'un déterminant construit sur les m équations à m+1 inconnues (les coefficients Cmi et les ei relatifs), ce qui conduit à l'équation séculaire du système étudié :
Sa résolution consiste alors à développer ce déterminant et à en trouver les racines (les ei) qui l'annulent. Chaque racine sera ensuite injectée à tour de rôle dans les équations de Hartree-Fock-Roothaan afin d'en obtenir les coefficients Cmi :
Le système n'est linéaire qu'en apparence car les éléments de matrice Fmn sont quadratiques dans les Cmi. Toutefois, pour pouvoir le résoudre on suppose qu'il est linéaire et on travaille de façon auto-cohérente. On remarque aussi que contrairement aux équations intégro-différentielles de Hartree-Fock, le système d'équations (12) est un système d'équations algébriques. Elles peuvent donc se ramener à l'équation séculaire, écrite dans sa forme générale déterminantale :
qui peut aussi s'écrire sous la forme matricielle suivante :
FC = SCE (13)
Les programmes de calculs travaillent généralement sous forme matricielle, ce qui évite de devoir résoudre des équations du nième degré (où n est le nombre de fonctions de base); ces équations, après transformation orthogonale, deviennent alors :
ce qui n'est rien d'autre qu'une équation aux valeurs propres et vecteurs propres, facilement résolvable par les ordinateurs. C est une matrice carrée des coefficients du développement et E est le vecteur des énergies.
L'équation ci-dessus est résolue d'une manière analogue à la résolution des équations de Hartree-Fock. Un premier essai est fait en utilisant des valeurs approchées pour les coefficients Cmi, la matrice de Fock est construite, puis elle est diagonalisée pour obtenir de nouveaux coefficients et de nouvelles énergies. Les nouveaux coefficients sont ensuite utilisés pour construire une nouvelle matrice de Fock et la procédure est répétée jusqu'à convergence des énergies ou des coefficients (dont le seuil est à fixer). L'énergie totale du système sera ensuite donnée par l'équation :
avec les éléments Pmn et Hmn précédemment définis.
Pour terminer, il faut encore remarquer que comme l'opérateur F est construit à partir de fonctions d'onde qui sont des approximations de celles de Hartree-Fock, il ne peut constituer qu'une forme approchée de l'hamiltonien de Hartree-Fock ; le système d'équations de Hartree-Fock-Roothaan ne constitue donc qu'une approximation des « vraies » équations de Hartree-Fock. La terminologie, « énergie Hartree-Fock » pour désigner le résultat de ces équations est donc abusive. En effet, si la base des OA était infinie, l'énergie E serait l'énergie de Hartree-Fock exacte, mais il n'en est rien. Les orbitales moléculaires obtenues dans l'approximation LCAO-MO ne sont donc que des approximations de celles de Hartree-Fock. Par convention, cependant, et sauf indication explicite, l'énergie issue du traitement Roothaan est appelée « énergie Hartree-Fock ».
Comme il l'a été dit, le choix de la base de fonctions représentant les orbitales atomiques est important car il peut influencer tant la précision des résultats obtenus que les temps de calculs.
On distingue plusieurs types de bases d'orbitales atomiques : pour les bases minimales on choisit pour orbitales atomiques celles qui sont effectivement occupées à l'état fondamental du système en y ajoutant les orbitales inoccupées de la couche de valence. Chaque orbitale cm n'est décrite que par une seule fonction (la fonction 1s de l'hydrogène, par exemple).
Les bases étendues sont composées de la base minimale, où chaque orbitale est décrite par deux fonctions, à laquelle sont ajoutées un certain nombre d'orbitales situées au-delà de la couche de valence des différents atomes; celles-ci sont appelées orbitales de polarisation (pour l'hydrogène: 1s, 1s', 2px, 2py et 2pz).
Les bases de valence ne comprennent quant à elles que les orbitales de la couche de valence de chaque atome et en général une seule fonction de base par orbitale. Les électrons des couches internes (dits électrons de coeur) ne sont pas décrits explicitement dans ce type de base, mais un potentiel reproduit leur effet.
Il semblerait naturel d'utiliser, comme orbitales atomiques, des fonctions de Hartree-Fock obtenues en résolvant l'équation du champ auto-cohérent pour les atomes libres. Leur défaut essentiel est de ne pas posséder de forme analytique, de sorte que le calcul des intégrales moléculaires est considérablement alourdi. Pour ces raisons, on a préféré, historiquement, la base de fonctions de Slater, qui sont de bonnes approximations des orbitales de Hartree et qui s'écrivent dans leur forme générale [10] :
(n,l,m) sont les nombres quantiques principal, azimutal et magnétique, (r,q,f) sont les coordonnées sphériques définissant la position de l'électron, a est une constante déterminée à l'aide de règles empiriques, visant à reproduire au mieux le comportement des orbitales hydrogénoïdes, et Ui,m(q,f) sont les harmoniques sphériques des parties angulaires des solutions de l'équation de Schrödinger pour les atomes de type hydrogénoïdes.
Par rapport aux parties radiales hydrogénoïdes qui sont de meilleures solutions du problème atomique, les fonctions de Slater ont le désavantage de ne pas avoir de noeuds radiaux et, pour toutes celles de type s (sauf la 1s), d'être nulles à l'origine, ce qui n'est pas le cas des hydrogénoïdes. On résout pratiquement ces difficultés en utilisant le plus souvent des combinaisons linéaires de fonctions de Slater comme fonctions de bases atomiques, ce qui permet d'obtenir des représentations précises des orbitales atomiques de Hartree-Fock-Roothaan. Toutefois, si l'on construit une base LCAO de ce type pour un calcul moléculaire, le calcul des intégrales biélectroniques sera particulièrement difficile. La raison en est que le produit de deux orbitales de Slater situées sur des centres différents ne peut être exprimé simplement par une seule fonction. On préfère donc en général utiliser des fonctions de Gauss cartésiennes. Ces fonctions, proposées par Boys [11], sont des puissances de x,y,z multiplié par , a étant une constante déterminant l'extension radiale de la fonction :
où i,j,k sont des nombres entiers simulant les nombres quantiques n,l,m. N est le facteur de normalisation et x est l'exposant de la gaussienne.
Par exemple :
Les gaussiennes sont des fonctions très populaires en chimie quantique, spécialement pour les méthodes ab initio, car le produit de deux gaussiennes centrées sur deux atomes A et B différents peut s'écrire à l'aide d'une seule gaussienne centrée en un point situé sur le segment AB. Le calcul des intégrales biélectroniques en ressort ainsi considérablement simplifié.
Bien que les fonctions de Slater soient peu commodes d'utilisation pour les calculs numériques, elles présentent l'avantage de décrire raisonnablement les orbitales atomiques. Les bases gaussiennes ont, par contre, une assez mauvaise représentation des orbitales atomiques car elles n'ont pas un comportement exact à l'origine (dérivée devant être nulle), ni aux grandes distances (décroissance trop rapide avec r). Pour compenser la représentation incomplète des orbitales atomiques des fonctions gaussiennes, on utilise donc des combinaisons linéaires de gaussiennes comme fonctions de base. Ces fonctions sont appelées « fonctions gaussiennes contractées ». Il faut en général utiliser trois fonctions gaussiennes pour que l'ajustement des parties radiales soit satisfaisant. On aura par exemple :
où d1, d2, d3 sont les coefficients fixes de cette combinaison linéaire appelée « STO-3G ».
Il existe bon nombre de bases de gaussiennes possibles. Les plus communément utilisées sont celles qui ont été développées par Pople et collaborateurs [12]. La plus simple est la base STO-3G, aussi appelée « base minimale ». Le sigle « 3G » signifie que les orbitales de type Slater (STO) sont représentées par trois fonctions gaussiennes. Le niveau suivant développé par Pople comprend les bases split-valence telles que 3-21G, 4-31G et 6-31G, où le premier chiffre représente le nombre de gaussiennes utilisées pour représenter les orbitales de coeur. Les orbitales de valence y sont représentées par deux fonctions qui sont composées du nombre de gaussiennes indiqué dans la seconde partie de la dénomination de la base. Ainsi la base 6-31G du carbone, par exemple, utilisera six gaussiennes pour représenter l'orbitale 1s, trois gaussiennes pour l'orbitale 2s et 1 gaussienne pour représenter les orbitales 2p.
Pour une plus grande flexibilité on peut encore rajouter des fonctions de polarisation. La dénomination la plus ancienne est l'ajout d'un astérisque sur la base en question (par exemple 6-31G*), et dans une désignation plus récente, le caractère de la fonction ajoutée est explicitement donné : 6-31G(d). La base 6-31G* ou 6-31G(d) signifie ainsi qu'un jeu de fonctions d a été ajouté à tous les atomes (sauf H) dans la molécule, alors que 6-31G** ou 6-31G(p,d) signifie qu'un jeu de fonctions p a été ajouté aux hydrogènes et que des fonctions d ont été ajoutées aux autres atomes.
Tous les électrons d'un atome ne jouent pas le même rôle. Ceux des couches internes (électrons de coeur) ne participent pas directement aux liaisons chimiques, alors que les électrons de la couche de valence sont les plus actifs. Il est donc parfois avantageux de remplacer les électrons de coeur par des potentiels effectifs ; la dimension du déterminant (6) en est ainsi réduite, en tenant compte de l'effet des orbitales de coeur par l'ajout de termes supplémentaires dans l'hamiltonien agissant sur cet espace réduit. En ne traitant explicitement que les électrons de valence on ne perd, en effet pratiquement aucune information sur les propriétés physico-chimiques des molécules, mais on réduit de façon significative le volume des calculs à effectuer, surtout si le système étudié contient des atomes lourds.
Dans le formalisme des pseudopotentiels de coeur les électrons des couches internes sont simulés par un opérateur monoélectronique appelé « pseudopotentiel » et l'un des avantages supplémentaires est que les effets relativistes peuvent être pris en compte dans le pseudopotentiel lui-même, et de ce fait un programme moléculaire non relativiste pourra être utilisé pour le calcul de molécules contenant des atomes des quatrième et cinquième lignes de la classification périodique.
Les nombreuses méthodes de calculs fondées sur l'approximation de Hartree-Fock utilisent généralement l'approximation LCAO-MO comme point de départ. Les méthodes non-empiriques (ou ab initio) effectuent une résolution rigoureuse de ces équations en calculant toutes les intégrales à deux électrons. Les méthodes semi-empiriques négligent quant à elles un grand nombre de ces intégrales, et calculent les autres de manière approchée en faisant intervenir des paramètres ajustables déterminés empiriquement.
L'énergie Roothaan est égale à l'énergie Hartree-Fock dans le cas où la base de fonctions utilisée est infinie. Dans la théorie Hartree-Fock, l'énergie la plus basse pouvant être obtenue est EHF, c'est la limite Hartree-Fock. Or, cette théorie est approximative ; elle néglige, comme il l'a été dit, l'énergie de corrélation des électrons. Les électrons de spin opposés (particulièrement ceux situés dans des orbitales ayant des parties spatiales similaires) exercent, en effet, les uns sur les autres des forces répulsives dépendant de leurs positions instantanées. Or, dans le modèle des particules indépendantes de Hartree-Fock, cet effet est en partie négligé puisque l'on suppose que chaque électron se trouve dans le champ moyen crée par tous les autres. La contribution à l'énergie totale de cette interaction interélectronique d'origine quantique est faible, mais elle devient importante lorsque de petites différences d'énergie doivent être calculées.
D'après Löwdin [13], l'énergie de corrélation d'un système correspond à la différence entre l'énergie Hartree-Fock et l'énergie exacte non-relativiste du système :
Le modèle Hartree-Fock est certes très utile pour prédire certaines propriétés atomiques ou moléculaires, mais les méthodes post Hartree-Fock sont parfois nécessaires pour retrouver l'énergie de corrélation, car un traitement de la corrélation électronique plus poussé peut se révéler essentiel pour l'obtention de certaines propriétés atomiques ou moléculaires. La recherche des fonctions d'onde sera donc rendue plus compliquée, et pour ce faire, plusieurs méthodes ont été proposées, comme il l'a déjà été mentionné en introduction au chapitre I. Deux grandes catégories de méthodes existent actuellement : les méthodes à référence unique et les méthodes multiréférencées.
La fonction d'onde HF ne décrit pas correctement le comportement des électrons à proximité du noyau et surestime la probabilité de trouver deux électrons proches l'un de l'autre. Ces effets de corrélation à courte distance sont dus au trou de Coulomb [14] et l'énergie de corrélation qui en découle est appelée, comme déjà dit, « corrélation dynamique ». Les effets de corrélation à longue distance contribuent, quant à eux, à l'énergie de « corrélation non dynamique » (ou statique) et à cause de ces effets, les calculs HF ont tendance à sous-estimer les longueurs de liaison. Lorsque ces effets sont faibles, la fonction d'onde HF fournit une bonne description du système et pour récupérer l'énergie de corrélation, des méthodes post-HF basées sur une référence unique suffisent.
Par chance, cette situation est la plus répandue (systèmes à l'état fondamental proche de l'équilibre) ; par contre, dans les autres situations, la description mono-déterminantale de la théorie HF est insuffisante (états excités, molécules proches de la dissociation ou états électroniquement quasi-dégénérés). Dés lors il faut utiliser des méthodes post-HF multiréférencées (MCSCF, MRCI) qui ne seront pas décrites ici.
La méthode de perturbation Møller-Plesset [23] est une adaptation aux systèmes polyélectroniques de la théorie, plus générale, développée par Rayleigh et Schrödinger et connue sous le nom de théorie des perturbations à plusieurs corps (MBPT).
Dans la théorie de perturbation de Møller-Plesset, l'hamiltonien total est séparé en deux : une partie qui a les fonctions propres et les valeurs propres du déterminant Hartree-Fock, et une partie perturbée V. L'énergie est alors exprimée comme une somme de ces deux contributions :
F étant l'opérateur de Fock, et V étant le potentiel de corrélation défini par :
On connaît déjà les solutions de l'équation :
La théorie des perturbations stipule que si V est petit par rapport à F, on peut alors développer l'opérateur H = F+lV en série de Taylor selon l, d'où :
Et on peut ainsi montrer que :
La perturbation la plus couramment utilisée est la perturbation au deuxième ordre. Elle est connue sous le nom de « MP2 ». Cette méthode permet de récupérer une grande partie de l'énergie de corrélation. Elle n'est cependant pas variationnelle et est basée sur une référence unique (la fonction d'onde de Hartree-Fock). Cette méthode est très efficace et requière dans la pratique des temps de calculs acceptables, proportionnels à N5, où N est le nombre d'électrons du système étudié.
Il existe d'autres méthodes à référence unique telle que l'interaction de configuration (CI) ou la méthode « coupled cluster » (CC). Il faut encore remarquer que les autres types de méthodes post-HF, telles que l'interaction de configuration, sont des méthodes variationelles, contrairement à la méthode de Møller-Plesset, ce qui implique que si les énergies obtenues par CI ne peuvent pas être inférieures à l'énergie réelle du système, les énergies calculées par la méthode de Møller-Plesset peuvent l'être.
Les techniques post-HF sont en général très efficaces pour retrouver l'énergie de corrélation, mais cependant à l'heure actuelle elles sont, pour la majeure partie d'entre-elles, trop lourdes pour être applicables à des systèmes dont le nombre d'atomes est grand. Il s'est ainsi parallèlement développé à ces techniques un modèle alternatif qui a atteint le statut de théorie à la fin des années 60. La théorie de la fonctionnelle de la densité (DFT) est actuellement la seule permettant l'étude de systèmes chimiques de grande taille avec la prise en compte des effets de la corrélation électronique de manière satisfaisante.
La théorie de la fonctionnelle de la densité est basée sur le postulat proposé par Thomas et Fermi qui dit que les propriétés électroniques peuvent être décrites en terme de fonctionnelles de la densité électronique, en appliquant localement des relations appropriées à un système électronique homogène [15]. Thomas et Fermi ont utilisé leur théorie pour la description d'atomes, mais le manque de précision, ainsi que l'impossibilité de traiter des systèmes moléculaires en ont fait un modèle trop simpliste lorsqu'il a été proposé.
Hohenberg et Kohn, en 1964 [16], ont repris la théorie de Thomas-Fermi et ont montré qu'il existe une fonctionnelle de l'énergie E[r(r)] associée à un principe variationnel, ce qui a permis de jeter les bases de la théorie de la fonctionnelle de la densité. Des applications pratiques ont ensuite été possibles grâce aux travaux de Kohn et Sham (KS) [17] qui ont proposé, en 1965, un set d'équations monoélectroniques analogues aux équations de Hartree-Fock à partir desquelles il est en principe possible d'obtenir la densité électronique d'un système et donc son énergie totale.
Fonctionnelle et dérivée fonctionnelle sont des entités mathématiques de première importance dans la théorie DFT. Mathématiquement, on désigne par « fonctionnelle » une entité qui fait correspondre un nombre à chaque fonction provenant d'une classe définie. En d'autres termes, c'est une fonction de fonction. La notation d'une fonctionnelle est F[f(r)], où r est une variable de la fonction f. La dérivée fonctionnelle est la quantité telle que :
L'équation (15) représente la série coupée jusqu'au terme linéaire de dr. Comme il va l'être vu plus avant, il existe une correspondance biunivoque entre la densité électronique d'un système et le potentiel externe v(r). La densité électronique r(r) constitue la grandeur fondamentale de la DFT, et les termes de l'hamiltonien électronique (4) utilisé en début de ce chapitre peuvent s'écrire en fonction de matrices densité, grandeurs qui généralisent la notion de densité électronique.
La densité électronique r(r1) de l'électron 1, de coordonnées r1, est en fait l'élément diagonal d'une matrice densité 1 r1(r1',r1). Si y est la spin-orbitale donnant la densité r(r1), on peut alors calculer r(r1) d'après l'expression :
où les si sont les coordonnées de spin et les ri sont les coordonnées d'espace. r1 est donc une « matrice densité d'ordre 1 » [25].
De la même manière, on défini une « matrice densité d'ordre 2 » r2(r1'r2', r1r2) dont l'élément de matrice diagonal est r2(r1r2,r1r2) = r2(r1r2) et dont l'expression est :
Il est important de noter que l'intégrale sur tout l'espace de r(r1) donne le nombre d'électrons N total du système, tandis que la matrice densité d'ordre 2 intègre sur le nombre de paires d'électrons
Plus généralement, on peut construire une matrice que nous appellerons matrice densité d'ordre p, et telle que :
où correspond au coefficient binômial.
Dans le cadre de la description des propriétés régies par des intéractions interélectroniques, les matrices densité d'ordre 1 et 2 suffisent.
Avec ces nouvelles grandeurs il est maintenant possible de réécrire chacun des composants d'énergie provenant de l'hamiltonien (4) :
On constate que le terme Vee[r] est composé de deux parties; la première correspond à l'interaction coulombienne classique J[r], et la seconde partie dite non-classique est appelée « énergie d'échange et de corrélation ».
Les deux théorèmes de Hohenberg et Kohn formulés en 1964 [16] ont permis de donner une cohérence aux modèles développés sur la base de la théorie proposée par Thomas et Fermi à la fin des années 30.
Le premier théorème démontre que pour un système électronique décrit par un hamiltonien H de la forme de celui utilisé en début de ce chapitre (4), le potentiel externe v(r) est déterminé, à une constante additive près, par la densité électronique r(r) du système. Comme r(r) détermine le nombre d'électrons, la densité nous permet donc d'accéder à toutes les propriétés électroniques relatives à l'état fondamental du système.
On peut alors utiliser la densité électronique comme variable de base pour la résolution de l'équation de Schrödinger électronique. Etant donné que r(r) est liée au nombre d'électrons du système, elle peut en effet également déterminer les fonctions propres Y de l'état fondamental ainsi que toutes les autres propriétés électroniques du système ; si N est le nombre d'électrons du système, on a que :
Connaissant la densité électronique r(r) d'un système, on a donc accès au nombre d'électrons, au potentiel externe, ainsi qu'à l'énergie totale Ev[r]. Celle-ci peut s'écrire sous la forme :
où FHK[r] = T[r]+Vee[r] est la fonctionnelle universelle de Hohenberg et Kohn.
FHK[r] est une fonctionnelle prenant en compte tous les effets interélectroniques ; elle est indépendante du potentiel externe, et elle est donc valable quelque soit le système étudié. La connaissance de FHK[r] permet l'étude de tous les systèmes moléculaires, malheureusement la forme exacte de cette fonctionnelle est à l'heure actuelle loin d'être connue, et il faut avoir recours à des approximations.
Le second théorème établit le principe variationnel de l'énergie Ev[r]. Pour une densité électronique d'essai, , telle que et , on a toujours
La condition pour qu'une fonctionnelle telle que Ev[r] admette un extremum est que sa dérivée fonctionnelle s'annule. D'après la définition :
La relation dEv = 0 est donc vérifiée si :
La résolution du problème consiste dés lors à chercher à minimiser Ev[r] avec la contrainte . On résout le problème une fois encore par l'utilisation de multiplicateurs de Lagrange. Soit :
La contrainte devient G[r] = 0, et si on introduit une fonctionnelle auxiliaire A[r] telle que :
où m est un multiplicateur de Lagrange, le problème se résume alors à résoudre :
soit :
Il faut alors calculer la dérivée fonctionnelle de A[r] :
Si l'on remplace l'expression ci-dessus dans l'expression de dA[r], il vient :
et il reste à calculer la dérivée fonctionnelle de Ev[r]. D'après les équations (15) et (19), il vient :
En remplaçant cette dernière équation dans l'expression (20), on obtient l'équation fondamentale de la DFT, qui est une équation de type Euler-Lagrange :
où la quantité m est appelée « potentiel chimique » du système.
Les théorèmes de Hohenberg et Kohn ne donnent cependant aucune information sur la manière de trouver la fonctionnelle FHK[r], et il va donc falloir trouver une méthode adéquate pour traiter ce problème.
Calculer la densité électronique de l'état fondamental en connaissant sa fonction d'onde est un problème trivial. Par contre, plusieurs fonctions d'onde différentes peuvent conduire à la même densité. Dés lors, connaissant la densité électronique de l'état fondamental, comment trouver la fonction d'onde correspondante ?
La réponse est donnée par la recherche par contrainte établie par Levy [18] qui généralise le deuxième théorème de Hohenberg et Kohn. Le principe variationnel établit que :
Cette minimisation peut être réalisée en deux temps :
Ainsi, on cherche les fonctions d'onde conduisant à cette densité et minimisant l'énergie parmi toutes les densités électroniques. On montre alors que le problème peut s'exprimer en fonction de la fonctionnelle universelle de Hohenberg et Kohn :
avec :
où Vee est l'énergie d'interaction interélectronique. La relation ci-dessus propose une recherche par contrainte de la densité électronique : la recherche de la fonction d'onde de l'état fondamental se fait uniquement parmi les fonctions d'onde conduisant à la densité r. Par conséquent, la fonctionnelle F minimise la valeur moyenne des opérateurs d'énergie T+Vee pour toutes les fonctions d'essai Y décrivant la densité r.
La fonctionnelle de Hohenberg et Kohn contient une composante d'énergie cinétique T[r] et une composante d'énergie potentielle Vee[r]. Cette dernière peut, comme il l'a déjà été dit, elle-même se scinder en une partie classique (la répulsion coulombienne), notée J[r], et une partie d'origine quantique, K[r]. Thomas et Fermi avaient proposé une approximation de T[r], mais celle-ci, comme il l'a été dit, s'est révélée être insuffisante pour décrire de manière satisfaisante l'énergie cinétique des systèmes électroniques. Kohn et Sham ont proposé en 1965 [17] de calculer une énergie cinétique approchéeTs[r] en introduisant les orbitales.
Cette méthode, plus indirecte, est donc basée sur l'utilisation d'orbitales qui permettent d'évaluer avec une bonne précision l'énergie cinétique ; une faible correction étant apportée dans un second temps. La formulation exacte de l'énergie cinétique pour l'état fondamental est la suivante :
où les yi sont les spin-orbitales naturelles du système et ni est leur nombre d'occupation respectif. Le principe de Pauli impose la condition 0 Ł ni Ł 1 et selon la théorie de Hohenberg-Kohn, l'énergie cinétique T est une fonctionnelle de la densité électronique totale donnée par :
Pour un système où les électrons sont sujets à des interactions, il y a néanmoins un nombre infini de termes dans les expressions de T et de r.
Ces équations correspondent en fait au cas où ni = 1 pour N orbitales, et ni = 0 pour le reste. Cette condition n'est valable que pour les fonctions d'onde déterminantales décrivant un système à N électrons sans interactions. Afin d'avoir une unique décomposition en termes d'orbitales conduisant à une seule valeur exacte pour TS[r], Kohn et Sham ont proposé, par analogie avec la définition de la fonctionnelle universelle de Hohenberg et Kohn, un système de référence sans interactions, et l'énergie cinétique est calculée selon l'expression :
la quantité T[r]-Ts[r] étant cependant faible.
A priori Ts[r] n'est pas l'énergie cinétique du système étudié ; Kohn et Sham ont reformulé le problème de manière à ce que le système de référence d'électrons non-intéragissant ait la même densité électronique que l'état fondamental du système étudié. Pour cela, ils ont réécrit la fonctionnelle F[r] de la manière suivante :
F[r] = Ts[r] + J[r] + Exc[r]
avec :
Exc[r] = T[r] - Ts[r] + Vee[r] - J[r]
La quantité Exc[r] est appelée « énergie d'échange-corrélation ». L'équation (21) devient alors :
avec le potentiel effectif Veff :
où vxc est le potentiel d'échange-corrélation, dérivée fonctionnelle de Exc[r] par rapport à r(r). L'équation (22) est exactement la même que celle de la théorie de Hohenberg et Kohn pour un système d'électrons non-intéragissant se déplaçant dans un potentiel effectif de la forme de veff(r).
En appliquant le principe variationnel, on obtient alors un ensemble d'équations du type Hartree-Fock que l'on résout par un processus intératif :
La densité électronique est ensuite obtenue par la sommation :
Pratiquement, on choisit une densité d'essai à partir de laquelle on calcule un potentiel effectif veff(r). En injectant veff(r) dans l'expression (23) on obtient une nouvelle densité électronique (24). La convergence est alors atteinte lorsque le potentiel effectif ne varie plus.
Ces équations sont analogues à celles obtenues par la méthode de Hartree-Fock, mais contiennent un potentiel local plus général Veff(r). Les théories quantiques vues dans ce chapitre (Hartree, Hartree-Fock et Kohn-Sham) conduisent toutes à un système d'équations mono-électroniques, mais le formalisme de Kohn-Sham permet néanmoins de tenir compte, de manière intrinsèque, de l'effet dû à l'échange et à la corrélation électronique.
Il faut encore ajouter que le terme Veff(r) ne contient pas d'opérateur de spin, et chaque solution pour ei est doublement dégénérée ; on a donc les deux cas suivants :
Pour le cas « closed-shell », on aura :
Pour un système à couches ouvertes, on aura par contre :
Cette condition de restriction découle directement de la théorie, alors que dans le cas Hartree-Fock elle était la conséquence de l'approximation orbitale de Hartree. Il faut noter que les orbitales utilisées dans l'équation de Kohn-Sham sont celles conduisant à un minimum pour l'énergie totale et sont obtenues de manière auto-cohérente. La signification physique de ces orbitales n'est cependant pas claire ; l'orbitale HOMO permet néanmoins d'obtenir la valeur du potentiel d'ionisation, sur la base du théorème de Janak.
Kohn et Sham ont donc permis à la DFT de devenir un outil efficace pour l'étude des systèmes chimiques. Actuellement, la très grande majorité des calculs DFT sont réalisés dans le cadre de ce formalisme ; les approximations qui vont brièvement être décrites ci-après s'inscrivent dans le cadre du formalisme de Kohn-Sham.
La difficulté principale dans le développement du formalisme de Kohn-Sham réside dans la construction des fonctionnelles d'échange-corrélation. L'approximation locale dite « LDA » stipule qu'en première approximation la densité peut être considérée comme étant localement constante. On peut dés lors définir l'énergie d'échange-corrélation de la manière suivante :
où exc(r) est la densité d'énergie d'échange-corrélation.
Cette approximation découle directement du modèle du gaz homogène d'électrons. Par ailleurs, si l'on partitionne l'énergie d'échange-corrélation en deux (énergie d'échange ex et énergie de corrélation ec) telle que :
exc = ex + ec
on peut utiliser l'énergie d'échange proposée par Dirac [26] comme approximation de ex :
La fonctionnelle de corrélation la plus utilisée a été développée par Vosko, Wilk et Nusair en 1980 [27]. Ces auteurs ont utilisé les résultats de calculs Monte Carlo effectués par Ceperley et Alder pour ajuster une expression analytique de l'énergie de corrélation. Cette fonctionnelle est connue sous l'abréviation « VWN ».
Dans la pratique, la méthode LDA se montre plus performante que les calculs Hartree-Fock. On constate cependant qu'en général cette approximation a tendance à raccourcir les longueurs de liaison dans les molécules et, par conséquent, à surestimer les énergies de liaison. De plus, il est très fréquent que les barrières d'activation des réactions chimiques soient largement sous-estimées. Les fréquences de vibration sont par contre généralement en bon accord avec l'expérience (l'écart étant souvent inférieur à 5 %).
Depuis 1985 d'énormes efforts ont contribué à l'amélioration des fonctionnelles d'échange-corrélation. Ces travaux ont débouché sur une deuxième génération de fonctionnelles incluant l'inhomogénéité de la densité électronique : ces fonctionnelles prennent donc en compte la densité électronique ainsi que son gradient.
La densité électronique d'un système est non seulement pas uniforme, mais peut même varier très rapidement dans l'espace (lorsqu'on passe d'une couche électronique à l'autre dans un atome, ou lorsqu'on passe d'un atome à l'autre dans une molécule). La première amélioration que l'on puisse apporter à la méthode LDA consiste donc à exprimer la fonctionnelle d'énergie d'échange-corrélation en fonction de la densité électronique et de son gradient.
Cette technique est appelée « approximation de l'expansion du gradient » (GEA). Elle se révèle efficace pour les systèmes dont la densité électronique ne varie que lentement. Pour les systèmes chimiques, il s'avère qu'elle donne des résultats moins bons que LDA. La solution consiste alors à réécrire l'expression d'échange-corrélation sous une forme similaire à LDA :
où excGGA est la densité d'énergie d'échange-corrélation. La difficulté réside dés lors dans la recherche d'expressions analytiques de excGGA.
De nombreuses fonctionnelles ont été developpées depuis, tant pour l'échange que pour la corrélation. Parmi les plus connues et les plus utilisées on peut citer les fonctionnelles d'échange de Becke (B88) [28] et de Perdew et Wang (PW91) [29]. Pour la corrélation, on dispose, entre autres, des fonctionnelles de Perdew (P86) [30], de Lee, Yang et Parr (LYP) [31] et de Perdew et Wang (PW91) [29]. Toutes ces fonctionnelles permettent une amélioration de l'estimation des énergies de liaison dans les molécules, ainsi que des barrières d'énergie par rapport à l'approximation locale LDA.
Il faut encore citer les fonctionnelles dites « hybrides », basées sur le formalisme de la connection adiabatique [32]. Le principe émerge de la question demandant s'il est possible d'utiliser l'échange de Hartree-Fock dans le formalisme de Kohn-Sham. La formule de la connection adiabatique justifie théoriquement la détermination de l'énergie d'échange HF à partir de l'énergie des orbitales Kohn-Sham. L'utilisation de la partie d'échange HF associée aux fonctionnelles GGA fournit des résultats comparables à ceux de l'approximation des gradients généralisés. La première fonctionnelle de ce type a été proposée par Becke, et contient 50 % d'échange HF ; c'est la fonctionnelle « half and half » [33]. Elle présentait l'inconvénient de contenir une trop forte proportion d'échange HF, et la fonctionnelle de ce type actuellement la plus utilisée est celle connue sous l'acronyme B3LYP [34]. Celle-ci est une fonctionnelle à trois paramètres combinant les fonctionnelles d'échange local, d'échange de Becke et d'échange HF, avec les fonctionnelles de corrélation locale (VWN) et corrigée du gradient de Lee, Yang et Parr.
Enfin, de nouveaux travaux ont récemment été entrepris afin de développer de nouvelles fonctionnelles ab initio sans paramètres. A l'heure actuelle, il n'existe qu'une seule fonctionnelle de ce type, élaborée par Perdew, Burke et Ernzerhof (PBE) [35], qui s'est montrée très efficace pour les calculs de géométries, de fréquences et d'énergies d'excitations électroniques.
Les développements théoriques ont permis de faire de la physique quantique appliquée à la chimie un outil indispensable associé à la chimie expérimentale.
Nous avons eu ainsi moyen, dans ce chapitre, de constater qu'au cours des années de développement de la chimie quantique deux voies se sont dégagées ; l'une aborde les problèmes en décrivant les systèmes par une fonction d'onde, l'autre le fait par le biais de sa densité électronique.
Les méthodes DFT souffrent cependant d'un manque de procédures systématiques qui permettent d'améliorer les fonctionnelles et les propriétés moléculaires calculées, ce qui n'est pas le cas avec les calculs ab initio pour lesquels il est à priori possible d'augmenter la qualité des résultats en augmentant le niveau de calculs ou la qualité de la base de fonctions. La seule limitation dans le cas ab initio étant naturellement liée au temps requis pour effectuer de tels calculs.
Il a été vu que ces deux méthodes peuvent parfois être utilisées conjointement, et il ne serait pas si surprenant que dans un futur proche, ces deux théories donnent naissance à une nouvelle théorie mixte dans laquelle la fonctionnelle d'énergie serait orbitalairement dépendante et non plus densité-dépendante [36].
La possibilité d'intégrer les effets dus au solvant pour le calcul des différentes propriétés des systèmes chimiques reste un challenge dans la chimie quantique, car cela implique l'intervention de la mécanique statistique et donc, l'ajout de difficultés d'ordre supérieur. La majorité des réactions chimiques et biologiques ont cependant lieu en solution, et le désir du chimiste théorique est donc celui de pouvoir posséder et utiliser des modèles permettant de tenir compte des effets dus au solvant.
Tomasi et Persico [42,45-46] ont proposé de diviser les différentes approches possibles du traitement des effets de solvant en quatre catégories :
La partie de théorie présentée ci-après ne se veut être qu'une introduction des différentes méthodes de solvatation ; pour plus de détails, l'excellent article de Tomasi et Persico [46] les passe en revue, tout en présentant les éléments mathématiques absents ici.
L'idée de modéliser les interactions électrostatiques dues au solvant en plaçant le soluté dans une cavité de taille définie date des travaux de Kirkwood [43] et Onsager sur les effets de solvatation sur les molécules polaires [44]. A partir de l'équation de Laplace (ou de Poisson), et sous certaines conditions limites, plusieurs modèles ont été par la suite proposés [41-50]. Dans cette approche, le soluté, traité de manière quantique, est placé dans une cavité entourée de molécules de solvant considérées comme un continuum. Ce modèle de continuum simple est le « modèle de la cavité d'Onsager », souvent dénommé « modèle SCRF », pour « Self-Consistent Reaction Field ».
Les modèles de type « continuum » impliquent toutes sortes de formes de cavité contenant le soluté, et le solvant se trouvant en-dehors est traité comme un milieu continu, caractérisé par quelques-unes seulement de ses propriétés comme sa constante diélectrique, par exemple. Le champ électrique produit par les particules chargées comprenant le soluté interagit alors avec ce milieu, produisant une polarisation, ce qui se reflète sur les fonctions d'onde du soluté.
La cavité représente la portion de l'espace où la densité de solvant est nulle et où le soluté prend place. Il est bien connu que la réponse d'un milieu diélectrique continu à toute distribution de charge consiste en une distribution de charge de surface à l'interface entre les deux. Le problème, non trivial, consiste dès lors à calculer cette charge de surface ; la partie la plus difficile étant de résoudre l'équation de Poisson avec une telle condition de manière analytique simple.
n(r) est le vecteur normal de la surface en un point r et E- (r) est le champ électrique total à l'intérieur de la surface en ce point. Les charges d'écran s devant se calculer de manière itérative (elles viennent s'ajouter aux cycles SCF de la molécule isolée), les méthodes incluant les effets de solvatation requièrent donc des temps de calculs plus longs.
L'approche la plus simple utilise des séries de Taylor pour représenter l'expansion classique multipolaire de la structure électronique. Cette expansion est tronquée au terme dipolaire et seules les interactions des charges atomiques et des dipôles avec le milieu sont donc prises en compte. L'approche SCRF utilise une cavité idéale (sphérique ou ellipsoïdale) qui permet une solution analytique pour le calcul de l'énergie d'interaction entre le multipôle du soluté et celui du continuum. Ces simplifications conduisent à des problèmes de précision, et cette méthode est très sensible au choix du rayon de la cavité, mais pas tant à la constante diélectrique (pour les solvants particulièrement polaires).
Ce modèle est implémenté en standard dans les programmes comme « GAMESS » ou le « GAUSSIAN » de la manière la plus simple possible :
L'interaction électrostatique du soluté ne peut être résumée en ces deux termes uniquement. Au final, la restriction de la cavité sphérique n'est donc pas représentative de la véritable forme du solvant, et seul dans les cas spéciaux de molécules particulièrement sphériques, le modèle SCRF peut se montrer suffisant.
Récemment, une approche de type continuum utilisant une généralisation du formalisme de Born pour l'interaction entre les charges atomiques partielles et le milieu diélectrique a été proposée [52]. Dans le principe, les monopoles centrés sur les atomes génèrent tous les multipôles requis pour représenter la distribution électronique.
Une méthode plus sophistiquée encore, dénommée « Polarizable Continuum Model » (PCM) a été développée par Tomasi et ses collaborateurs [45-47]; celle-ci permet de travailler avec des cavités de forme plus réaliste, avec une surface découpée en une sorte de mosaïque constituée de petits polygones sphériques. L'interaction électrostatique entre le soluté et le solvant est dans ce cas décrit par un ensemble de charges ponctuelles polarisables, placées au centre de chaque petit 'morceau' (tessera). Ce modèle est donc beaucoup plus versatile en termes de description réaliste de la cavité et plus précis en ce qui concerne l'énergie due à l'interaction électrique entre le soluté et le milieu environnant.
La méthode PCM place ainsi le soluté dans une cavité formée par l'union de sphères centrées sur chaque atome et le potentiel électrostatique du soluté est décrit par la production d'une charge apparente (de surface) sur la surface de la cavité, ce qui implique un plus grand réalisme pour l'interaction électrostatique. Le traitement par ordinateur divise la surface en de petits morceaux sur lesquels la charge (et sa contribution au gradient) est évaluée. Sur la base de différentes études, on a défini la taille de ces sphères comme ayant un volume équivalent à environ 1,2 fois le rayon de Van der Waals [45-50].
Le modèle COSMO-PCM (CPCM) représente quant à lui une approche différente basée sur l'implémentation du « Conductor like Screening Model (COSMO) of solvation » [49-50]. Dans le modèle COSMO, le milieu environnant est décrit par un conducteur et non plus par un milieu diélectrique (e = Ľ), permettant de fixer les conditions limites initiales. Les termes d'énergie calculés en premier lieu pour le conducteur, sont ensuite divisés par un facteur de scaling décrit par la fonction :
où x est un facteur de correction empirique (fixé par comparaison avec les valeurs obtenues pour des cas analytiques simples impliquant un milieu diélectrique) et e est la constante diélectrique (ici de l'eau), ce qui permet de revenir au milieu diélectrique originel.
Cette technique simplifie les calculs d'interactions électrostatiques et les corrections sont effectuées à posteriori pour le comportement diélectrique. Les implémentations actuelles de ce modèle incluent le calcul de multipoles allant jusqu'aux hexadecapoles pour représenter la densité de charge de la molécule de soluté. Cette distribution induit à son tour une distribution de charge à la surface de la cavité et cela est pris en compte dans les cycles de calculs SCF, ce qui permet un traitement auto-cohérent pour les fonctions d'ondes moléculaires et les charges de la surface.
Il est généralement reconnu que les erreurs de cavité sont plus faibles dans la méthode COSMO-PCM (CPCM) que dans la méthode PCM seule, ceci étant dû à l'utilisation, dans COSMO, de conditions limites exprimées en termes de potentiel électrostatique plutôt qu'en termes de champ électrique.
Ces modèles ont cependant de nombreuses limitations ; l'une des plus importantes étant qu'ils ne permettent pas de tenir compte de l'aspect dynamique des effets entre le soluté et le solvant (liaisons hydrogène, par exemple). Malgré cela, ces méthodes de solvatation peuvent être utilisées (approche du continuum ; méthodes SCRF et PCM) afin d'améliorer les énergies et les géométries des espèces chimiques intervenant dans mécanismes réactionnels, par exemple.
Les dérivés alkylés du catéchol sont des intermédiaires courants dans la synthèse d'agents d'assaisonnement, de produits pour l'agriculture ou encore de produits pharmaceutiques. Parmi ces produits, le 3-méthyl-catéchol est le plus coûteux. Il est industriellement produit par une méthylation catalytique homogène en présence d'un acide minéral comme catalyseur. L'agent alkylant est le méthanol et le but des travaux effectués par l'équipe du Professeur Renken en 1997 (Porchet et collaborateurs) était d'obtenir une production sélective du 3-méthylcatéchol.
Plusieurs études concernant l'alkylation des phénols ont été réalisées ces dernières années, mais Porchet et collaborateurs ont utilisé, comme catalyseur, une surface de g-alumine à cause de son degré d'activité très élevé et surtout à cause de sa grande sélectivité dérivant de ses propriétés amphotères [1-3].
La méthylation catalytique du catéchol conduit en effet à différents produits pouvant être classés en deux groupes : les produits monométhylés et les produits polyméthylés [i-ii]. La formation des produits monométhylés est thermodynamiquement favorisée (en maintenant une température assez basse) et les trois principaux produits sont le 3- et 4-méthyl-catéchol, ainsi que le guaiacol (2-méthoxy-phénol) ; ce dernier, instable, étant facilement convertible en 3-méthyl-catéchol (voir figure 3.1).
Après avoir été adsorbé sur la surface du catalyseur, le catéchol réagit avec le méthanol (lui aussi à l'état adsorbé). En essayant de comprendre ce qu'il se passe à la surface du catalyseur, il est possible d'en améliorer la sélectivité, en le dopant, par exemple, avec des ions tels que le Mg2+ ou le Ca2+.
Des études de cinétique ont montré qu'à des températures de 260-300 °C le produit O-méthylé (guaicol, A2) et les produits C-méthylés (A3, A4) sont formés dans deux réactions parallèles. Le rapport de méthylation O/C ne peut être changé qu'en modifiant les propriétés acide-base du catalyseur et en maintenant constantes les autres conditions expérimentales [ii]. Les résultats fournis par les différentes recherches effectuées ont permis de proposer que le mécanisme passe par une adsorption du catéchol et du méthanol sur des sites acide-base de la surface de g-alumine. La sélectivité entre les produits O- ou C-méthylés semble être contrôlée par la quantité et la force de ces sites en tant qu'accepteurs et donneurs d'électrons. La sélectivité pour les produits C-méthylés (formation des produits A3 et A4) est contrôlée quant à elle par l'orientation du catéchol adsorbé sur la surface. Porchet, Kiwi-Minsker et collaborateurs [i-ii] ont effectué une analyse des fréquences de vibration des espèces adsorbées à la surface afin d'essayer de comprendre le type et le mode d'adsorption sur le catalyseur.
Dans le cadre de ce travail, des méthodes de calculs quantiques ont été utilisées afin d'essayer de comprendre le mode d'adsorption du méthanol sur la surface de g-alumine (Al2O3). Pour ce faire, différents modèles d'adsorption ont été étudiés, et les fréquences de vibration de ces systèmes ont été calculées afin de les comparer aux fréquences obtenues expérimentalement [1-3]. L'étude de l'adsorption du catéchol qui nécessite l'utilisation de méthodes de dynamique moléculaire (entraînant des temps de calculs très importants) n'a pas été effectuée. L'approche du cluster d'atomes a été utilisée afin de simuler la surface de g-alumine. Ces dernières années, il a été en effet montré que ce modèle constitue une approche élégante pour l'investigation de la chimisorption sur des surfaces métalliques et non-métalliques [4-6]. Différents clusters ont été étudiés, puis le cluster conduisant aux résultats les plus proches de l'expérience a été enrobé de charges ponctuelles afin d'essayer de reproduire l'influence du reste de la surface de g-alumine sur l'adsorbat.
Par spectroscopie infra-rouge il est possible d'observer la modification des fréquences de vibration des deux molécules lorsqu'elles sont adsorbées (le catéchol et le méthanol perdent l'un des hydrogènes des groupes -OH lors de l'adsorption). Porchet et collaborateurs ont observé que les deux bandes nst -OH du catéchol à 3663 et 3603 cm-1 (correspondant aux deux isomères détectables de cette molécule) disparaissent lors de son adsorption sur la surface de g-alumine [1-3].
Les vibrations du cycle aromatique ne sont quant à elles pas modifiées et les auteurs en ont conclu que le catéchol ne se place pas parallèlement au plan de la surface (comme dans le cas d'une adsorption p) ; le plan de la molécule fait en réalité un angle de 118-120° avec la surface, comme il l'a été observé par Taylor et collaborateurs [31]. Ceci explique la sélectivité vis-à-vis de la méthylation en position C3 (la plus accessible).
Dans cette configuration, la molécule transfère un proton à la surface de g-alumine et l'ion phénoxyde en résultant est chimiquement adsorbé sur la surface. Le second groupe -OH est fixé à la surface via une liaison hydrogène [3]. La sélectivité découlant de l'angle de 120° peut donc être expliquée par des considérations stériques : le méthanol réagit depuis la surface où il est lui aussi adsorbé [29-31] et la distance entre l'oxygène du catéchol (site de l'alkylation dans le cas de la formation du guaiacol) et la surface d'alumine est très courte, ce qui favorise la formation du guaiacol (2-méthoxy-phénol). L'autre site d'alkylation conduisant au 3-méthyl-catéchol est lui aussi très proche, ce qui explique l'ordre de sélectivité guaiacol > 3-méthyl-catéchol.
Le modèle de surface proposé par Knözinger et Ratnasamy [35], basé sur des études effectuées par Peri [32-33] sur des surfaces d'alumine a permis de mettre en évidence le fait que celle-ci contient différentes sortes de groupes hydroxyles. La fréquence de vibration -OH la plus élevée (à 3730 cm-1) dans le spectre IR de la g-alumine correspond au groupe -OH le plus basique de la surface (entouré de quatre oxydes stabilisant l'ion aluminium insaturé). Le second hydroxyle le plus basique ne côtoye quant à lui que trois oxydes et se trouve à côté d'un aluminium portant une charge positive (bande à 3688 cm-1).
Ces deux bandes disparaissent lorsque le catéchol est adsorbé sur la surface de g-alumine (ceci se voit facilement sur la figure III.2 : pic "négatif" à 3688-3730 cm-1). Lorsque l'on chauffe le système à 500 °C en présence d'air, la bande à 3688 cm-1 est restaurée, mais la bande à 3730 cm-1 ne l'est pas. Les groupes hydroxyles de la surface peuvent cependant être régénérés en la chauffant en présence de vapeur d'eau. L'un des groupes -OH du catéchol perd son proton lors de l'adsorption et forme, avec le groupe -OH le plus basique de l'alumine, une molécule d'eau, ce qui explique pourquoi la désorption ne reconstitue pas la bande à 3730 cm-1. Le deuxième hydroxyle le plus basique de la surface ne participe pas à la déprotonation (car il n'est pas suffisamment basique), mais il peut prendre part au phénomène d'adsorption par la formation d'une liaison hydrogène; la fréquence de vibration est alors décalée mais peut être restaurée après désorption du catéchol.
Dans un article plus récent, Porchet et collaborateurs [3] ont proposé une hypothèse différente selon laquelle le catéchol perd ses deux protons pour s'adsorber sur deux ions aluminium de la surface. Les fréquences de vibration des liaisons C-O perturbées étant ainsi modifiées.
Taylor et Lundlum [31], avaient déjà proposé deux modes différents pour l'adsorption du phénol sur une surface d'alumine: l'un où le phénol perd son proton et un autre où l'adsorption se fait via une liaison hydrogène. Le catéchol est un cas plus compliqué puisqu'il possède deux groupes -OH ; néanmoins, quel que soit le mode d'adsorption, la structure du catéchol ainsi adsorbé sur la surface est adéquate pour favoriser l'alkylation sur l'oxygène ou sur le carbone C3. D'autre part, les propriétés amphotères de la g-alumine sont très importantes ; les groupes -OH basiques catalysant l'adsorption des réactants et des produits sur les ions aluminium.
L'adsorption du méthanol est similaire à celle du catéchol: la liaison O-H est rompue, comme il l'a été confirmé par des études isotopiques [20]. Le spectre IR représenté par la figure III.5 montre bien l'absence de la bande à 3712 cm-1 correspondant à la vibration stretching O-H.
Dans de nombreux travaux, il est accepté le fait que le méthanol forme une liaison covalente avec la surface de g-alumine (par départ d'une molécule d'eau), et les données des spectres infrarouges semblent confirmer cette hypothèse [29-36].
L'adsorption des alcools sur les oxydes est une réaction du type acide-base et il est établi que ceux-ci se comportent de manière analogue à l'eau. D'après les informations fournies par Porchet [1-3], les espèces résultant de cette adsorption sont principalement des méthoxyles bidentés liés à deux acides de Lewis (les Al3+ de la surface du catalyseur). Les groupes hydroxyles isolés de la surface sont alors perturbés et les groupes les plus basiques peuvent déprotoner l'alcool. La chimisorption sur un site acide polarise la liaison C-O et il en résulte l'apparition d'une charge partielle positive sur le groupe méthyle, ce qui augmente son caractère électrophile, comme il a été proposé par Moravek [21].
La région de 4000-3100 cm-1, caractéristique des vibrations d'élongation des groupes -OH, montre la disparition, après l'adsorption sur la surface du catalyseur, de la bande entre 3712 et 3660 cm-1 (pic central à 3680 cm-1); l'adsorption provoque également la disparition des vibrations des groupes hydroxyles de la g-alumine entre 3780 et 3650 cm-1 (bande principale à 3730 cm-1). La région des fréquences O-H de la surface stabilisée par des liaisons hydrogène (entre 3650 et 3300 cm-1) est, de plus, faiblement perturbée.
Après l'adsorption, la bande large des vibrations d'élongation du groupe -CH3 du méthanol gazeux est transformée en deux bandes bien définies (à 2949 et à 2844 cm-1) caractéristiques de la présence des groupes méthoxyles adsorbés à la surface du catalyseur. La bande obtenue expérimentalement à 2949 cm-1 correspond à la vibration d'élongation asymétrique du -CH3 et la bande à 2844 cm-1 correspond quant à elle à la vibration symétrique. Ce second pic possède une « épaule » à 2824 cm-1; ce phénomène a été observé par Busca et collaborateurs [20] sur la d-alumine après adsorption du méthanol à température ambiante. Selon ces auteurs, il s'agit de deux espèces de surface qui se distinguent par la coordination de l'ion aluminium auquel l'oxygène du méthanol est lié.
La vibration de déformation angulaire de la liaison O-H du méthanol (à 1330 cm-1) disparaît après l'adsorption. Sur la g-alumine on n'observe pas de bandes caractéristiques du méthanol physisorbé (déformation angulaire du groupe -OH à 1480, 1440 ou 1420 cm-1 suivant la coordination des ions aluminiums).
La liaison C-O du méthanol gazeux est caractérisée par une bande d'adsorption située à 1034 cm-1. Si le méthanol était physisorbé à la surface du catalyseur, il devrait montrer une fréquence de vibration C-O faiblement perturbée. L'adsorption dissociative des alcools sur des surfaces d'oxydes montre cependant un déplacement de la fréquence de stretching C-O vers des nombres d'onde plus élevés ; la liaison semble donc se renforcer et prendre un caractère de double liaison [31]. Lorsque le méthanol est adsorbé sur la g-alumine, on observe une bande principale à environ 1090 cm-1, ainsi qu'une petite épaule à 1186 cm-1. Cette bande correspond à la vibration d'élongation de la liaison C-O des groupes méthoxyles de surface, alors que l'apparition de la bande à 1186 cm-1 est associée avec la déformation dans le plan du groupe -CH3 du méthanol adsorbé à la surface.
Les bandes d'adsorption correspondant à des nombres d'onde supérieurs à 1110 cm-1 sont généralement associées à des espèces méthoxyles monodentées, c'est à dire liées à un seul cation métallique. Les vibrations qui absorbent à des fréquences inférieures à 1100 cm-1 sont, quant à elles, spécifiques d'espèces polydentées. D'après les résultats obtenus par Porchet [3], l'adsorption du méthanol conduit à la formation d'espèces polydentées principalement. La réactivité de ces différentes espèces est différente, mais une réaction nécessitant la formation d'un ion électrophile CH3+ sera plus aisée avec une espèce bidentée puisque la liaison C-O est dans ce cas plus polarisée [31].
Les géométries stables et les fréquences de vibration du méthanol et du catéchol libres en phase gazeuse ont été calculées à l'aide de méthodes de calculs ab initio aux niveaux Hatree-Fock et MP2, ainsi que par des méthodes de DFT. Le programme GAUSSIAN 94 [ 2 ] a été utilisé à cet effet.
L'optimisation des géométries à l'aide de bases de fonctions telles que 3-21G, 6-31G et des fonctions polarisées 6-31G** [67-68] a permis de faire une étude complète de l'influence du choix de la base sur les géométries et les fréquences de vibration, en comparant les résultats obtenus à l'expérience.
Les calculs DFT ont aussi été effectués en partie à l'aide du GAUSSIAN 94 avec la fonctionnelle B3LYP [ 3 , 4 ], et du programme de DFT, ADF 2.1 [ 5 , 6 ] avec la fonctionnelle BP86 [8,12]. Ce programme utilise une approche où les électrons des couches profondes des atomes sont traités par l'approximation des coeurs gelés [11]; pour les orbitales atomiques des couches de valence de l'aluminium (3s, 3p), du carbone, de l'oxygène (2s, 2p) et de l'hydrogène (1s), des fonctions non-contractées triple-z, augmentées de fonctions de polarisation p pour l'hydrogène, et de fonctions d pour les atomes d'aluminium, de carbone et d'oxygène, ont été employées (base ADF de type IIII) [14]. Un set de fonctions STO auxiliaires s, p,d et f centrées sur les noyaux des atomes, permettant d'améliorer les énergies coulombienne et d'échange dans chaque cycle SCF [13], a été employé pour améliorer la densité électronique. L'intégration numérique développée par Te Velde et al [15] a été utilisée avec une précision numérique de 10-5 hartrees pour l'énergie et le critère de convergence SCF a été fixé à 10-3 hartrees.
Il est bien connu que les fréquences de vibration calculées au niveau Hartree-Fock sont surestimées d'environ 10-12 % [69,77], ceci étant dû au fait que la corrélation électronique ainsi que les effets d'anharmonicité ne sont pas pris en compte. Un facteur correctif est donc en général introduit. Pour les fréquences calculées en 3-21G, le facteur correctif de 0,89 appliqué est celui utilisé pour les bases de taille plus importante, et pour les calculs MP2, le facteur correctif vaut 0,94 car seuls les effets dus à l'anharmonicité sont présents. Enfin, pour la DFT le facteur utilisé vaut 0,97. Il est néanmoins aussi possible d'utiliser un facteur différent pour chaque mode de vibration (ce qui peut être discutable), mais dans notre cas une valeur unique a été utilisée.
Cette étude préliminaire a permis de déterminer le niveau de calcul ainsi que les fonctions de base les plus adaptées au problème. Les résultats obtenus ont été comparés à ceux de précédentes études [37-38,41-46,73-75], et aux données expérimentales [16,76].
Il a ainsi été confirmé que la stabilisation exceptionnelle de la forme (E,Z) du catéchol est due à la formation d'une liaison hydrogène entre les deux groupes -OH, comme le montre la figure III.8 [38,41].
Dans le méthanol, le groupe méthyle a la possibilité de tourner par rapport au groupement -OH, et ceci conduit à différents conformères possibles. Les calculs ont confirmé que la conformation anti du méthanol est la forme la plus stable de cette molécule.
Les fréquences de vibration du méthanol dans la conformation anti ont été calculées au niveau HF à l'aide de différentes bases (3-21G, 6-31G et 6-31G**), et les données structurales et spectroscopiques ont été caractérisées et comparées avec celles fournies par les expériences de diffraction électronique et micro-ondes de Blom et collaborateurs [43-44] ; elles sont présentées dans la table III.1.
Comme le montre la table III.2, les méthodes DFT semblent conduire aux meilleurs résultats, puisque l'erreur moyenne n'est que de 19 cm-1. Cependant, cette erreur oscille, c'est à dire que les fréquences obtenues sont ou trop grandes, ou trop petites. Etant donné que l'erreur commise au niveau Hartree-Fock n'est pas trop importante (32 cm-1) et surtout constante, la suite du travail a été effectuée à l'aide de cette méthode.
Il faut noter que le mode de vibration stretching de la liaison -OH est affecté expérimentalement par la formation en phase liquide de liaisons hydrogène, ce qui conduit à des différences avec les fréquences calculées. Les fréquences des stretching C-H sont, de plus, scindées par le phénomène de résonance de Fermi, ce qui déplace les fréquences de 1-2 %. Enfin, les effets d'anharmonicité sont responsables d'une correction de 3-5 % pour les vibrations C-H. Tous ces facteurs montrent qu'il n'est pas facile de comparer des résultats théoriques avec l'expérience ; cependant, ces résultats sont très proches de ceux obtenus théoriquement par Hameka sur les alcools saturés [16] dans les mêmes conditions de calcul.
Plusieurs modèles de surface et de modes d'adsorption ont été étudiés afin d'obtenir des résultats les plus proches possible de l'expérience. L'approche du cluster d'atomes a été utilisée à cet effet.
Différentes études ont montré que la surface de g-alumine peut être modélisée par de petits clusters d'atomes ne contenant que 1-3 atomes d'aluminium [17-19]. La condition étant que chaque atome d'aluminium doit être saturé de groupes -OH ou HOH [19]. De plus, pour un modèle de surface (110) comme celui considéré dans ce travail, le cluster doit contenir des atomes d'aluminium présentant les deux types de coordination (tétraédrique et octaédrique).
L'avantage de l'utilisation du modèle du cluster d'atomes pour simuler une surface entière réside dans la taille relativement petite du système à calculer, ce qui ne nécessite pas des temps de calculs trop longs. Cependant, les clusters utilisés sont trop petits pour prétendre reproduire correctement le comportement d'une surface quasi infinie. Pacchioni [69,70] a montré que cette méthode donne tout de même d'assez bons résultats pour l'étude de la chemisorption, pour le calcul des fréquences de vibration ou encore des spectres de photoémission (pour un système CO adsorbé sur MgO, par exemple), et l'introduction de charges ponctuelles permet en outre d'ajouter les effets dus au potentiel de Madelung provenant de l'environnement autour du cluster. Ce potentiel, qui tient compte des phénomènes électrostatiques uniquement, permet de mieux décrire l'adsorption d'une molécule sur la surface, mais il ne permet toutefois pas de tenir compte de la contribution orbitalaire entre la molécule s'adsorbant et les atomes substrats de la surface.
Ainsi, afin d'étudier le phénomène d'adsorption, différents clusters de surface de la g-alumine ont donc été considérés afin de simuler la surface entière en y liant de manière covalente un ion méthoxyle (résultant de l'adsorption d'une molécule de méthanol sur la surface), en comparant à chaque fois les fréquences de vibration calculées avec l'expérience. Puis l'un de ces clusters a été entouré de charges ponctuelles (embeded cluster model) afin de simuler l'effet des autres atomes de la surface et de reproduire le potentiel de Madelung généré par celle-ci.
Le modèle de g-alumine a été construit à l'aide de l'interface Crystal builder du programme « CERIUS2 » [26] à partir des données cristallographiques connues [27].
La g-alumine possède trois types d'aluminium (avec des taux d'occupation cristallographique différents), mais seuls deux d'entre eux ont été considérés, le taux d'occupation du troisième aluminium étant très faible [32-36]. Grâce aux coordonnées cristallographiques, il a été possible de générer un cristal de g-alumine.
a = 7.911 Å | b = 7.911 Å | c = 7.911 Å |
a = 90° | b = 90° | g = 90° |
Cette opération a été faite à l'aide de l'interface Surface builder du programme « CERIUS2 » [26]. Le cristal de g-alumine a été coupé selon un plan ayant les indices de Miller (110), car d'après Knötzinger [35], l'activité catalytique d'une surface produite par un tel clivage est maximale. Plusieurs problèmes sont néanmoins à considérer dans une telle opération : la surface doit être neutre et respecter la bonne stoéchiométrie, et elle doit, de plus, être assez large et suffisamment profonde (1,8 mailles ont été prises lors du clivage du cristal) pour simuler correctement la surface catalytique.
Si l'on représente la surface (110) en mode space filling (les atomes étant représentés par des sphères selon leur rayon de Van der Waals), celle-ci met en évidence des creux, sites potentiels de l'adsorption du méthanol ; l'un de ceux-ci a été choisi pour y lier de manière covalente l'ion méthoxyle.
Idéalement, l'étude de l'adsorption devrait se faire en utilisant le plus grand cluster possible pour modéliser la surface, mais ceci n'est pas réalisable à cause des temps de calculs prohibitifs que cela entraînerait. Après examen de la surface, on voit que celle-ci n'est pas régulière à cause des atomes d'aluminium non équivalents (tétraédriques et octaédriques); comme il l'a été déjà suggéré, le site d'adsorption le plus vraisemblable pour le méthanol devrait être l'un de ceux-ci. Plusieurs clusters différents ont été considérés et leurs caractéristiques sont résumées ci-après.
Ces différents clusters ont été découpés dans la surface de manière à contenir au moins un aluminium octaédrique et un aluminium tétraédrique ; pour assurer la neutralité, les aluminiums ont été saturés par des groupes hydroxyles et par des groupes -OH2+ pour contrebalancer l'excès de charges négatives. Il faut remarquer que d'autres sites sont possibles si l'on clive le cristal selon des plans ayant des indices différents que (110), mais ceux-ci n'ont pas été considérés pour des raisons déjà évoquées.
Le cluster II, de formule brute [Al3O9H10]+, contenant un aluminium tétraédrique et deux aluminiums octaédriques (la présence du second aluminium octaédrique étant nécessaire pour décrire le site d'adsorption correctement) a conduit aux résultats les plus proches de l'expérience, comme il va l'être présenté ci-après.
Le modèle d'adsorption décrit par le système ci-dessus a conduit à des résultats très proches de l'expérience et donne ainsi crédibilité à celui proposé par Moravek et collaborateurs [21], dans lequel le méthoxyle est lié de manière covalente à un aluminium tétraédrique et forme une interaction stabilisante avec l'aluminium octaédrique proche :
Il n'a malheureusement pas été possible de comparer les géométries calculées avec l'expérience, puisqu'il n'existe pas de données structurales de l'adsorbat sur la surface d'alumine [1]. Si l'on compare les tables III.1 et III.3, on peut cependant remarquer que la liaison C-O devient plus courte avec l'adsorption (1,412 Å contre 1,418 Å pour B3LYP) ce qui est en accord avec Berteau et collaborateurs [22] qui avaient conclu que la liaison C-O prend un caractère de double liaison lors de l'adsorption. De plus, l'angle Al-O-C dans l'adsorbat est plus grand que l'angle C-O-H dans le méthanol libre et différents effets peuvent en être à l'origine ; parmi ceux-ci, la formation d'une liaison hydrogène avec un groupe -OH de surface proche ou des effets dus à la surface de g-alumine.
Les vibrations ont été comparées, lorsque cela a été possible, avec celles fournies par Porchet [1-3], et celles-ci sont assez proches des fréquences obtenues expérimentalement (voir table III.4).
Les résultats du calcul des fréquences HF/6-31G** sont très proches de l'expérience puisque la fréquence de la liaison C-O ne diffère que de 6 cm-1 pour le mode de stretching, par exemple. Les fréquences obtenues montrent, de plus, qu'il n'y a aucune bande caractéristique d'espèces physisorbées (absence de bandes de type bending à 1480, 1440 et 1420 cm-1 pour le méthanol).
Si le méthanol était physisorbé, il devrait en effet être caractérisé par un mode stretching C-O à 1034 cm-1 analogue à celui de la molécule libre en phase gazeuse. Or, aucune bande n'a été obtenue pour cette fréquence. La liaison C-O est au contraire caractérisée par un mode stretching à 1090 cm-1, ce qui montre que durant l'adsorption dissociative du méthanol un déplacement des fréquences stretching vers des valeurs plus élevées a lieu. Ainsi, la liaison C-O devient plus forte et montre effectivement un caractère de double liaison [31] (table III.5).
Des charges ponctuelles ont été introduites dans le but de simuler les effets électrostatiques dus à la surface de g-alumine et essayer ainsi d'améliorer les fréquences de vibration obtenues par le calcul. Ces effets peuvent en effet être reproduits en remplaçant les atomes d'aluminium et d'oxygène de la surface immédiatement voisins du cluster d'atomes découpé par des charges ponctuelles.
Cette méthode a cependant posé beaucoup de problèmes à l'époque de cette étude car l'optimisation de la géométrie ainsi que le calcul des fréquences de vibration avec des charges ponctuelles n'est pas possible avec le GAUSSIAN 94. Les fréquences de vibration ont pour cette raison dû être calculées « manuellement ».
Pour ce faire, les vecteurs de déplacement atomiques donnés par le GAUSSIAN (dans le cas du système cluster-méthoxyle sans charges ponctuelles) ont été utilisés pour évaluer les fréquences dans le cas du système cluster-méthoxyle enrobé de charges ponctuelles. La géométrie est alors variée pas à pas selon le mode normal considéré, et l'énergie est calculée à chaque pas (calcul single point). Les fréquences sont ensuite déterminées à partir de la courbe d'énergie potentielle qui en résulte et cette procédure est répétée pour chacun des modes normaux de vibration. Cette méthode a l'avantage de conduire à l'obtention de toutes les fréquences de vibration étant donné qu'elle permet d'étudier tous les modes normaux ; il est néanmoins très important que le centre de masse ne varie pas lorsqu'on ajoute les charges ponctuelles.
Cette technique a initialement été appliquée à deux clusters sans l'ajout de charges ponctuelles (clusters II et V), afin de tester la validité de la méthode, et pour permettre une comparaison entre les fréquences obtenues sans les charges ponctuelles et avec les charges ponctuelles (voir les résultats présentés en annexe).
Pour obtenir les vecteurs de déplacement des atomes du méthoxyle en évitant toute erreur due au fait que certains modes vibrationnels impliquent aussi des atomes de la surface, il a fallu effectuer un calcul des fréquences de vibration du méthoxyle seul (non lié au cluster), à la géométrie optimisée pour le système complet méthoxyle-cluster, afin de pouvoir ensuite utiliser les vecteurs de déplacements obtenus pour le calcul des single points (en attribuant un déplacement nul aux atomes du cluster). Cette méthode a conduit à des résultats satisfaisants puisque le centre de masse du système entier est conservé (celui de la surface ne se déplace pas puisque celle-ci est fixe, alors que pour le méthoxyle, le déplacement selon les coordonnées normales maintient le centre de masse fixe par définition). Les résultats correspondants sont résumés en annexe.
Pour l'étude des fréquences de vibration du méthoxyle adsorbé avec l'ajout des charges ponctuelles, un nouveau cluster d'atomes totalement symétrique a été découpé de la surface de g-alumine précédemment modélisée, et l'ensemble des charges ponctuelles a été choisi, lui aussi, de manière à être totalement symétrique (d'où le choix d'un cluster, le cluster V, possédant un plan symétrie vertical, plutôt que le cluster II, moins symétrique) afin que le méthoxyle ressente un champ électrostatique le plus homogène possible, avec une charge de -1 distribuée sur 1003 atomes. Chaque atome enrobant le cluster a donc été remplacé par une charge correspondant à son état d'oxydation (+3 pour les atomes d'aluminium et -2 pour les atomes d'oxygène), car d'après la littérature ceci constitue une bonne approximation pour les surfaces ayant un caractère ionique assez prononcé [69-70].
Les résultats obtenus pour le système, avec et sans les charges ponctuelles sont présentés dans la table 3.6.
Etant donné que les charges ponctuelles influencent de manière assez importante la géométrie du méthoxyle ; il a fallu ré-optimiser les longueurs de liaison ainsi que les angles du méthoxyle par single points avant le calcul des fréquences (en variant la position des atomes selon les coordonnées normales). La liaison C-O s'allonge en particulier d'environ 10 % lorsque le méthoxyle se trouve en présence des charges ponctuelles ; cela s'explique par le champ électrique créé par les charges qui a un effet répulsif sur le méthyle (la charge de l'aluminium étant plus grande que celle de l'oxygène).
Le calcul des fréquences de vibration a montré que celles-ci sont généralement plus basses avec l'ajout des charges ponctuelles, ce qui signifie que les effets de charges ont pour conséquence l'affaiblissement des liaisons.
La table 3.6 montre que mis à part pour le stretching C-O, l'introduction des charges ponctuelles semble améliorer les fréquences des autres modes stretching, alors que les modes bending sont nettement moins bons. Ceci provient vraisemblablement du fait que la géométrie n'est que grossièrement optimisée pour le système enrobé de charges ponctuelles ; les modes bending ressentent les effets dus au champ électrique de manière plus importante que les stretching.
Le modèle du cluster d'atomes a conduit à des résultats proches de l'expérience ; l'erreur commise sur les fréquences de vibration oscille en effet entre 10 et 60 cm-1. Le mode d'adsorption du méthanol a pu ainsi être rationalisé et comparé à celui proposé par Moravek [21].
Cette étude a de plus mis en évidence l'importance des groupes -OH de la surface. Ces groupes, en permettant la formation de liaisons hydrogène avec le méthyle, stabilisent en effet le système et rendent l'adsorption encore plus favorable. L'utilisation d'un cluster plus gros n'a, par contre, pas permis d'améliorer la qualité des fréquences de vibration calculées, mais ceci est certainement dû aux dimensions modestes de la molécule de méthanol.
L'introduction des charges ponctuelles a posé un très grand nombre de problèmes étant donné l'impossibilité d'effectuer des optimisations de géométrie ou des calculs de fréquences sur de tels systèmes par la version 94 du « GAUSSIAN » utilisée pour ce travail. Ainsi, beaucoup de temps et d'énergie ont été dépensés afin de trouver une méthode qui puisse contourner ce problème. La technique « manuelle » pour le calcul des fréquences de vibration s'est démontrée être assez fiable et simple à utiliser, à condition de pouvoir effectuer un calcul préliminaire qui fournisse les vecteurs de déplacements correspondants aux modes normaux ; pour des systèmes plus gros tels que le catéchol, cela nécessiterait cependant des temps de calculs plus longs. D'autres méthodes, comme par exemple les techniques semi-empiriques (beaucoup plus rapides) pourraient être envisagées dans ce cas (soit pour le calcul des fréquences, soit pour l'obtention des vecteurs de déplacement).
L'ajout des charges ponctuelles n'a pas semblé apporter grand chose à la problématique ; un cluster de taille plus grande contenant plusieurs couches d'atomes aurait peut-être dû être utilisé afin de réduire les effets électrostatiques trop importants sur le méthoxyle qui y est lié ; effets provoqués par les charges ponctuelles ajoutées (surtout pour les liaisons proches de la surface comme la liaison C-O).
La théorie du champ cristallin (Crystal Field Theory) permet de rationaliser les interactions entre un métal et ses différents ligands, et fournit ainsi une voie très utile pour la compréhension des spectres électroniques ainsi que des propriétés thermodynamiques de ce type de composés. Les bases de ce modèle ont été proposées par Bethe et Van Vleck qui ont étudié l'effet d'un potentiel électrostatique créé par la présence de ligands sur les niveaux d'énergie d'un ion libre se trouvant dans une maille cristalline. Cette théorie consiste à placer n charges ponctuelles aux positions occupées par les ligands, et à étudier les effets résultant des interactions électrostatiques entre ces charges et les électrons d du métal. Dans le cas d'un complexe de symétrie octaédrique ML6 ces auteurs ont ainsi montré que les orbitales d du métal, dégénérées dans le cas de l'ion libre, sont toutes déstabilisées par la présence des ligands et une levée partielle de leur dégénérescence a lieu (figure 4.1).
Ion libre | Champ moyen (sphérique) de L6 | Champ octaédrique de L6 |
Ainsi, les orbitales d ayant leur lobes orbitalaires entre les ligands (dxy, dxz et dyz) voient leur énergie diminuer légèrement (orbitales t2g), alors que les orbitales se trouvant orientées selon l'axe des ligands (dx2-y2, dz2) sont sujettes à une forte répulsion électrostatique due aux ligands, et voient leur énergie augmenter (orbitales eg). Celles-ci sont déstabilisées car l'une des orbitales ressent l'influence des ligands axiaux (dz2) et l'autre ressent la répulsion des quatre ligands équatoriaux (dx2-y2). Les orbitales dxy, dxz et dyz du métal sont quant à elles stabilisées par rapport au champ moyen, car elles ressentent moins la répulsion du champ des ligands dans le complexe.
Ce modèle électrostatique ne reproduit naturellement pas de manière réaliste les interactions covalentes basées sur une approche orbitalaire, et le modèle plus réaliste du champ des ligands est en général utilisé. Dans ce modèle, les orbitales du métal se combinent avec celles des ligands de symétrie identique, et dans le cas d'un complexe de symétrie octaédrique (avec des ligands n'ayant pas d'orbitales p ou p*), les orbitales dxy, dxz et dyz du métal restent de nature métallique (set t2g) et seules les dz2 et dx2-y2 (set eg) vont se combiner avec les orbitales provenant des différents ligands à cause de leur symétrie. Les orbitales eg se combineront donc avec celles des ligands en formant respectivement deux orbitales liantes et deux orbitales anti-liantes.
On aura, par exemple, pour un complexe de symétrie octaédrique basé sur des interactions de type s uniquement, un diagramme d'orbitales moléculaires analogue à celui indiqué dans la figure 4.2. Si l'on considère que 12 électrons proviennent des ligands et occupent les orbitales de basse énergie a1g, t1u et eg, les électrons d provenant du métal occuperont les orbitales t2g et eg*. Cela amène à la notion d'éclatement octaédrique Doct (eg*-t2g) introduit par la théorie du champ cristallin qui permet de rationaliser la stabilité des complexes. Ainsi, on trouvera par exemple fréquemment des métaux d6 avec une configuration « bas spin » dans les complexes à 18 électrons, comme indiqué à la figure 4.3.
Les systèmes d6 bas spin à 18 électrons sont remarquablement stables car les six ligands amènent formellement 12 électrons et le métal n'amenant que 6 électrons, seules les orbitales t2g liantes seront remplies, laissant ainsi les orbitales eg* vides.
Il existe cependant de nombreuses exceptions, comme par exemple le système Fe(OH2)62+, dans lequel le fer est dans la configuration « haut spin ». L'énergie d'appariement des électrons requise dans ce cas est en effet plus grande que celle provenant de l'éclatement octaédrique. Il s'agit donc de faire un compromis entre l'énergie d'appariement et l'énergie provenant de l'éclatement octaédrique.
La différence d'énergie entre les orbitales eg et les orbitales eg* dépend naturellement du caractère s-donneur des ligands dans le complexe, et la stabilité de celui-ci dépendra donc de tous ces divers paramètres (spin bas/spin haut, nature des ligands, etc).
Il faut encore noter que bien que le rôle des orbitales p des ligands soit très important pour la stabilisation de certains systèmes par effet de p-retrodonation, ce phénomène n'est pas possible dans le cas des complexes hexa-aquo étudiés dans le cadre de ce travail car il n'existe pas d'orbitales ou d vacantes dans ces systèmes ; les orbitales t2g du métal restent donc quasiment de nature métallique et sont non-liantes dans ce type de complexe.
L'une des réactions fondamentales dans la chimie de coordination est le remplacement de l'un des ligands du métal par un autre ligand ; cette réaction est appelée « réaction de substitution ». Ces réactions procèdent selon une palette de vitesses très étendue ; le temps de réaction peut en effet aller de quelques nanosecondes, pour les aqua-ions de cuivre(II), à plus de 300 ans pour les aqua-ions d'iridium(III) ; la constante de vitesse s'étalant sur plus de 18 ordres de grandeurs.
Il est en général admis de séparer les complexes en deux catégories : les complexes labiles et les complexes inertes. Cette description empirique est basée sur le temps employé par la réaction de substitution pour se faire. Taube a proposé un modèle pour ces réactions dans lesquelles un ligand coordonné au métal central est remplacé par un autre ligand [61] :
Si le processus est complété en moins d'une minute (à 298 K avec une concentration de réactifs valant 0,1 M), le complexe sera considéré comme étant labile ; si la réaction prend plus de temps, le complexe sera alors dit inerte [49,61]. Cette propriété est naturellement liée au type d'ion et à son état d'oxydation.
Il est maintenant bien établi que les complexes de chrome(III) [61], de cobalt(III) [107], de rhodium(III) [8-9,59,106] et d'iridium(III) [10] sont particulièrement inertes [93]. On constate que cela concerne les complexes de métaux d3 ou de métaux d6 à spin bas. Orgel [94], puis Jørgensen [95] avaient déjà mis en évidence, au milieu du siècle dernier, le fait que la stabilisation due au champ des ligands est déterminante pour la cinétique d'une réaction de substitution ou d'échange.
Basolo et Pearson [50] ont utilisé une approche basée sur le champ des ligands afin d'essayer de rationaliser ces observations. En se basant sur les travaux de Hush [93], ces auteurs ont montré comment il est possible d'associer l'énergie liée à l'effet de stabilisation due au champ des ligands (LSFE) à l'inertie d'un complexe d'un métal dn donné, ainsi qu'à son mode de réaction de substitution (ceci en termes de Doct). En comparant l'énergie LSFE associée au complexe octaédrique de départ à l'énergie associée aux états de transition impliqués dans les deux mécanismes d'échange envisageables, il est possible de déterminer quel mécanisme sera préférentiellement suivi.
Les deux mécanismes d'échange possibles sont le mécanisme limite associatif, dans lequel le métal a un nombre de coordination plus élevé à l'état de transition (mécanisme analogue à la réaction SN2 organique), et le mécanisme limite dissociatif, dans lequel le métal passe par un nombre de coordination plus bas (mécanisme analogue à la substitution SN1 organique). Le mécanisme limite associatif implique donc un état de transition hepta-coordonné alors que le mécanisme limite dissociatif implique un état de transition penta-coordonné. L'espèce penta-coordonnée peut exister avec une symétrie pyramidale à base carrée ou trigonale bipyramidale, alors que l'espèce hepta-coordonnée sera de symétrie pentagonale bipyramidale.
Il est donc possible d'évaluer l'énergie due à la stabilisation du champ des ligands en faisant comme approximation que la magnitude du champ des ligands ne varie globalement pas lors du changement de coordination (variation du nombre de ligands), ceci se justifiant par le fait que la perte d'un ligand est compensée par la modification des distances de liaisons des ligands restant. La variation de l'énergie de stabilisation due à l'effet du champ des ligands entre le complexe de départ et l'état de transition est appelée « énergie d'activation du champ des ligands » (LFAE). Une diminution de cette énergie de stabilisation (LFAE > 0 selon la définition proposée) amènera donc une contribution positive à l'énergie d'activation globale requise par le processus (augmentation), alors qu'une contribution négative produira une diminution de l'énergie d'activation requise. L'énergie d'activation due au champ des ligands n'est toutefois qu'une composante de l'énergie d'activation totale ; il faut encore tenir compte en effet des énergies de rupture et de formation des liaisons des groupes entrant et sortant.
Les résultats collectés par ces auteurs ont pu cependant montrer que l'énergie requise pour les complexes d3 et d6 à spin bas est positive, quelque soit le type de coordination ou la géométrie de l'état de transition [50].
D'après l'exemple présenté dans la figure 4.6, on pourrait penser que le mécanisme impliquant un état de transition penta-coordonné sera favorisé pour les systèmes d3 car l'énergie d'activation requise est plus faible que pour le mécanisme passant par un état de transition hepta-coordonné. Les études successives sur les mécanismes d'échange ont cependant montré que cette conclusion est fausse [1,3-4,51-54]. Les calculs simplifiés des énergies d'activation dues au champ des ligands ne permettent donc pas une prédiction du mécanisme suivi ; il faudrait pour cela utiliser un meilleur modèle de l'état de transition et tenir compte des effets de la seconde sphère de coordination.
Ces calculs ont cependant l'intérêt de montrer que l'énergie d'activation due au champ des ligands est une contribution importante à l'enthalpie libre d'activation de Gibbs DG‡exp, c'est-à-dire à la réactivité des ions des métaux de transition.
Les réactions d'échange de solvant et plus particulièrement de molécules d'eau sur les aqua-ions des métaux sont fondamentales pour la compréhension de la réactivité de ces métaux dans les systèmes biologiques et chimiques. La compréhension de la réactivité intrinsèque de ces aqua-ions est en effet importante puisque le remplacement d'une molécule d'eau de la première sphère d'hydratation est une étape clé dans les réactions de formation de complexes. Les observations faites pour le Ni2+ ont montré que la connaissance des mécanismes d'échange de solvant est nécessaire pour la compréhension des mécanismes de substitution en général [1].
Dans une telle réaction d'échange, les réactants et les produits sont identiques ; les profils d'énergie sont donc caractérisés par l'absence d'une force thermodynamique poussant la réaction à se faire puisque la variation d'enthalpie libre de réaction de Gibbs vaut zéro.
En 1965 déjà, Langford et Gray [56] proposèrent un système de classification pour les réactions de substitution selon le type de mécanisme : celles-ci peuvent être de type associatif (A) dans lesquelles un intermédiaire ayant un degré de coordination plus élevé est détecté, dissociatif (D), dans lesquelles un intermédiaire de coordination plus basse est détecté, et de type concerté (I), dans lesquelles aucun intermédiaire n'est trouvé. Les chemins réactionnels A et D procèdent donc en deux étapes et font intervenir des intermédiaires respectivement hepta- et penta-coordonnés ; le mécanisme concerté n'impliquant quant à lui qu'une seule étape.
Langford et Gray proposèrent, d'autre part, de distinguer les mécanismes réactionnels caractérisés par un mode d'activation associatif (a) dans lesquels la constante de vitesse est plus sensible aux variations du groupe entrant que du groupe sortant, et ceux caractérisés par un mode d'activation dissociatif (d) où la constante de vitesse est influencée par le groupe sortant plus qu'elle ne l'est par le groupe entrant. Naturellement, tout mécanisme D doit être dissociativement activé, de même que tout mécanisme A doit être associativement activé. Les mécanismes concertés I sont caractérisés par un large spectre d'états de transition dans lesquels le degré de formation de liaison entre le ligand entrant et le métal central varie de l'important (mécanismes Ia) au négligeable (mécanismes Id) [51,53].
Une réaction d'échange de solvant doit naturellement être symétrique ; ainsi, pour un mécanisme Id avec un groupe entrant possédant une faible tendance à la formation de liaison, le groupe sortant devra lui aussi être faiblement lié au métal. Inversement, pour un mécanisme Ia, les ligands entrant et sortant devront tout deux être caractérisés par une liaison plus forte et plus courte avec le métal (ceci est présenté dans les figures 4.7 et 4.9).
L'approche habituelle pour l'élucidation des mécanismes de substitution implique l'étude de la dépendance de la vitesse de réaction avec la concentration des réactants, le pH, la force ionique, ainsi que la nature du solvant. Dans les réactions d'échange de solvant ces critères ne sont pas applicables, et il faut donc utiliser les paramètres d'activation obtenus par des études à température et pression variables : les mécanismes sont alors attribués en se basant sur les paramètres thermodynamiques comme l'enthalpie d'activation DH‡, l'entropie d'activation DS‡, l'enthalpie libre d'activation DG‡ ou encore le volume d'activation DV‡ [1-2].
Dans ce contexte, l'avantage principal du volume d'activation DV‡ est qu'il est facilement compréhensible en termes de mouvements atomiques uniquement, l'interprétation du DS‡ impliquant des facteurs moins tangibles et plus difficiles à interpréter. La variation de volume est en effet quelque chose de directement perceptible par les sens humains, alors que l'entropie est quelque chose de beaucoup plus abstrait. Ainsi, il est plus facile d'élaborer des théories basées sur le DV‡ plutôt que sur le DS‡, comme suggéré par Swaddle [39].
Merbach et ses collaborateurs ont donc proposé d'utiliser systématiquement le volume d'activation DV‡ comme critère d'identification du mécanisme [51]. Celui-ci permet en théorie d'attribuer un mécanisme à une réaction de substitution en général, et à une réaction d'échange de solvant en particulier. Le volume d'activation est défini comme étant la différence de volume molaire partiel entre les espèces à l'état de transition et les réactants de départ. Il est considéré comme étant la somme de deux contributions ; une contribution intrinsèque DV‡intr due aux changements de conformation du complexe lors du passage des réactifs à l'état de transition (variations dans les distances intra-atomiques durant la formation de l'état de transition) et une contribution d'électrostriction DV‡elec due aux changements de moments dipolaires et de charges du solvant :
DV‡exp = DV‡intr + DV‡elec
Dans le cas des réactions d'échange de solvant et pour des ligands neutres, la contribution d'électrostriction peut être considérée comme nulle ou négligeable. Le volume d'activation mesuré sera alors déterminé par la composante intrinsèque DV‡exp » DV‡intr, et il sera donc directement lié aux transformations prennant place dans la première sphère de coordination.
Sur cette base, la valeur du volume d'activation, DV‡, peut être positive ou négative. De ce fait, le mécanisme attribué sera D ou A respectivement. Entre ces deux mécanismes limites se trouvent les mécanismes concertés I, pour lesquels la valeur de DV‡ est proche de zéro ; ceux-ci peuvent être caractérisés par des modes d'activation (d) ou (a), selon que l'influence du ligand partant est plus grande que celle du ligand entrant, ou l'inverse (mécanismes Id ou Ia pour lesquels les valeurs du volume d'activation sont petites et positives ou petites et négatives) [1-2].
Dans le cas des mécanismes limites, D et A, le volume d'activation ne peut pas excéder ±V0, c'est-à-dire le volume molaire partiel du solvant. En fait, cette valeur limite doit être nettement inférieure pour tenir compte de la contraction ou de l'expansion des liaisons avec les molécules de solvant qui ne s'échangent pas.
D'un point de vue structurel, la seule différence entre les mécanismes Id et Ia est le degré d'expansion de l'état de transition. Arbitrairement, on parlera d'un mécanisme I lorsque DV‡ est voisin ou égal à zéro.
Swaddle a proposé des valeurs de DV‡ (reliées aux intermédiaires réactionnels) pour les deux mécanismes limites [110] ; le DV‡ mesuré expérimentalement n'est cependant pas relié de manière simple au mécanisme, et d'autre part le volume molaire de l'état de transition (qui est la quantité mesurée par l'expérience) est plus petit que celui de l'intermédiaire pentacoordonné correspondant, ou plus grand que l'intermédiaire heptacoordonné [3,4], ce qui explique pourquoi les valeurs limites estimées par Swaddle sont rarement atteintes. En général, le DV‡ ne permet donc de n'attribuer que le mode d'activation (a ou d) de la réaction de substitution, sauf dans le cas où le DV‡ mesuré est très grand positif, ou très grand négatif [111]. C'est par exemple le cas du Ti(OH2)62+ où le DV‡ vaut -13,5 cm3/mol et est très proche de la valeur prédite par Swaddle pour le volume d'un intermédiaire heptacoordonné (attribution d'un mécanisme A).
Sur cette base, d'après Rotzinger, il est important de garder en mémoire que dans la plupart des cas, les paramètres d'activation expérimentaux, en particulier le DV‡, ne permettent pas de distinguer des mécanismes A/D de mécanismes Ia/Id. Ainsi, d'après cet auteur pas tous les mécanismes proposés dans la littérature sur la base de mesures expérimentales sont à considérer comme étant définitifs [111].
Comme il l'a déjà été dit, le volume d'activation DV‡ est défini comme étant la différence entre le volume molaire partiel de l'état de transition et celui du réactant à une température T. Il est expérimentalement possible de déterminer les paramètres (pseudo) thermodynamiques (comme le volume d'activation DV‡) et cinétiques (constante de vitesse d'échange kex) par des techniques spectroscopiques (UV, MS, etc) ou par des techniques de RMN dynamique avec, pour les réactions plus lentes, couplage avec des méthodes de marquage isotopique. La loi cinétique décrivant l'échange isotopique peut être exprimée sous la forme :
où k est la constante de vitesse, x est la fraction molaire de ligand coordonné et xĽ est la fraction molaire de ligand coordonné à l'équilibre. Par intégration de l'équation (1), il est possible d'obtenir la relation entre la fraction molaire x et la constante de vitesse k :
L'expression (2) permet de décrire la diminution de x en fonction du temps, et celle-ci est déterminée par l'étude de la décroissance du signal RMN correspondant au ligand lié (ou du signal du ligand libre, selon le type de marquage) et par ajustement des valeurs expérimentales obtenues à l'équation (2).
Selon la théorie du complexe activé, la constante de vitesse de réaction kex, peut être reliée aux paramètres d'activation par la relation d'Eyring :
où k = transmission probability coeeficient (k » 1)
et kB = constante de Boltzmann
En mettant cette équation sous la forme logarithmique, on exprime l'enthalpie libre d'activation en fonction de T et de kex :
En dérivant le terme de l'enthalpie libre en fonction de la pression à température constante, on obtient alors le volume d'activation DV‡ qui permet d'exprimer la dépendance de la constante de vitesse k en fonction de P :
La constante de vitesse d'échange kex observée expérimentalement peut soit être diminuée, soit être augmentée par une variation de la pression, ceci dépendant du signe du volume d'activation. La dépendance de la constante de vitesse kex, avec la pression P, peut donc être reliée au volume d'activation au moyen de l'équation suivante :
ce qui permet d'en tirer la valeur du DV‡ et de caractériser ainsi le mécanisme d'échange.
La dépendance de la constante de vitesse avec la température permettra, de plus, d'en tirer les autres paramètres thermodynamiques tels que le DH‡ et le DS‡ par ajustements à l'aide de l'équation (3) où l'on a remplacé l'expression de DG‡ :
Comme il l'a déjà été dit, les réactions d'échanges d'eau peuvent s'écrire de la manière suivante :
Il a été expérimentalement observé ces dernières années que les ions divalents et trivalents de la première série des métaux de transition présentent un changement progressif dans le mécanisme de substitution [58]. Ainsi, les métaux de transition de la partie gauche du tableau périodique substituent plutôt selon un mécanisme A ou Ia, alors que les métaux de transition de la partie droite substituent avec un mécanisme Id voire D. Le changement du mode d'activation est observé après la configuration électronique d5 et, d'autre part, le long d'une colonne du tableau périodique, il y a passage vers des mécanismes de nature de plus en plus associative.
Pour la première période des métaux de transition, Merbach et ses collaborateurs ont obtenu la valeur du volume d'activation DV‡ la plus négative pour l'échange d'eau sur le Ti(III) [54] et la plus positive pour le Ni(II) [55], comme le montrent les valeurs résumées dans les tables 4.1. Les valeurs de DV‡ plus proches de zéro obtenues expérimentalement pour les autres éléments di- et trivalents de la première série des métaux de transition ont conduit à l'attribution de mécanismes I avec passage continu d'un mode (a) à un mode (d).
Comme il l'a été dit, dans un complexe octaédrique, en absence de liaisons p, les orbitales t2g sont non-liantes et les orbitales eg* sont s* anti-liantes. Les tables ci-dessus indiquent que le remplissage des orbitales t2g rend l'approche d'une septième molécule vers la face de l'octaèdre de moins en moins favorable électrostatiquement et permet d'expliquer la tendance vers des mécanismes de moins en moins associatifs. Le remplissage successif des orbitales eg* facilite quant à lui la dissociation d'une molécule de ligand.
Conclusion : lorsqu'on traverse une série des métaux de transition, on passe d'un mécanisme d'échange à caractère (a) à un mécanisme d'échange à caractère (d).
Ainsi, par exemple le Cr3+ (t2g3) échange des molécules d'eau selon un mécanisme Ia, alors que le Ga3+ (eg4) suit plutôt un mécanisme Id.
Etant donné que les intermédiaires réactionnels ont une durée de vie très courte, ils sont généralement inaccessibles par l'expérience. De plus, il n'est pas évident de distinguer un mécanisme limite A d'un mécanisme Ia, ou un mécanisme limite D d'un Id, d'où l'importance et l'utilité des techniques de modélisation moléculaire à l'aide de l'ordinateur.
Plusieurs études théoriques portant sur l'échange d'eau dans les ions hydratés des métaux de transition ont été effectuées ces dernières années. Åkesson et collaborateurs [33] ont étudié, les premiers, à l'aide de méthodes quantiques, l'échange d'eau pour les métaux de transition de la première période.
Ces travaux ont cependant fait l'objet de plusieurs critiques [3], car la méthode pour la détermination du mécanisme d'échange proposée par ces auteurs n'était pas très rigoureuse, et les résultats obtenus ont été interprétés de manière erronée à cause des états de transitions non optimisés qu'ils ont obtenus. Ils ont de plus proposé de se baser uniquement sur les énergies d'activation DE‡ calculées entre états de transition et réactants afin de déterminer le mécanisme réactionnel préférentiellement suivi (le mécanisme calculé avec la plus faible énergie d'activation étant favorisé). Rotzinger a montré que pour le vanadium(II) étudié par Åkesson et collaborateurs, les deux mécanismes D et Ia ont des énergies d'activation identiques et ce critère n'est donc pas fiable pour décider du mécanisme qui est préféré. D'autre part, ces auteurs ont calculé des énergies d'activation sur la base d'espèces qui ne correspondaient pas à des états de transition, mais à des intermédiaires réactionnels. Pour le mécanisme dissociatif des cations trivalents des métaux étudiés par Åkesson, les énergies des états de transition et des intermédiaires sont très proches, ce qui permet d'expliquer pourquoi ils ont en général obtenu d'assez bons résultats pour ces cas.
Dans son article de 1996, Rotzinger a proposé une méthode élégante pour l'étude théorique du mécanisme réactionnel de ces réactions d'échange, en obtenant une excellente corrélation avec l'expérience [3].
D'après cette méthode, afin de déterminer le mécanisme d'échange suivi, les trois mécanismes possibles (A, D et I) doivent être étudiés afin de pouvoir comparer les paramètres d'activation calculés avec l'expérience.
Les différentes espèces mises en évidence sur le chemin réactionnel calculé (réactants, états de transition et intermédiaires éventuels) sont à chaque fois caractérisées au moyen du calcul des fréquences de vibration (fréquences positives pour les réactants/produits et les intermédiaires ; une fréquence de vibration imaginaire pour les états de transition). Le chemin réactionnel le plus favorable étant alors identifié comme celui ayant la plus basse énergie d'activation, et l'attribution du mécanisme possible par comparaison avec les données expérimentales (énergie d'activation et volume d'activation expérimentaux) [3-4].
DEa‡ = E(TS) - E(GS)
correspondant à la réaction réactant ® état de transition.
Rotzinger a montré que sept molécules d'eau (hexa-aqua ion avec ajout d'une molécule d'eau de la seconde sphère de coordination) sont nécessaires pour une étude correcte des mécanismes associatifs ou concertés (A, Ia ou Id), mais que l'hexa-aqua ion seul, sans l'ajout de molécules d'eau additionnelles, suffit pour le mécanisme dissociatif [3,4]. La septième molécule d'eau peut naturellement être ajoutée pour l'étude d'un mécanisme D, mais son influence sur la structure de l'état de transition est négligeable.
Le modèle proposé implique donc un réactant de départ composé du métal de transition et de six molécules d'eau, pour un mécanisme dissociatif D (équation 2), et un adduit à sept molécules d'eau pour un mécanisme associatif A (équation 3) ou concerté I (équation 4) :
Lorsqu'un état de transition est obtenu par le calcul, il faut encore vérifier qu'il s'agit d'un véritable point de selle de premier ordre en calculant les deuxièmes dérivées de l'énergie (conduisant à une seule fréquence de vibration imaginaire). Puis, il faut contrôler que l'état de transition peut effectivement être relié aux réactifs et aux produits (à l'aide d'un calcul de type IRC, « Intrinsic Reaction Path », par exemple).
D'après Rotzinger, en vertu du principe de la réversibilité microscopique, les états de transition dans lesquels les ligands entrant et sortant ne sont pas symétriques et équivalents doivent être suivis d'intermédiaires réactionnels dans lesquels ces groupes sont symétriques et équivalents. Pour qu'une réaction d'échange puisse avoir lieu il faut en effet une étape où les ligands entrant et sortant sont symétriquement équivalents (soit pour l'état de transition, soit pour l'intermédiaire) [3,4].
Les variations des longueurs de liaison M-O, DSd(M-O) durant la phase d'activation indiquent si une compression ou une élongation se produit durant la réaction, et cette variation peut être corrélée à la composante intrinsèque du volume d'activation (DV‡int). On peut en effet montrer que l'élongation ou la compression d'une liaison donnée durant le processus d'activation affecte usuellement les autres liaisons « spectatrices » :
Le problème est rendu compliqué car tous les paramètres thermodynamiques mesurés expérimentalement décrivent la somme d'effets provenant du solvant, de la seconde sphère de coordination et du métal de transition lui-même. Pour l'échange d'eau, la contribution au DV‡ due à l'électrostriction de la seconde sphère de coordination et des molécules d'eau du solvant est néanmoins faible, et la valeur du volume d'activation expérimental reflète principalement les changements dans la première sphère de coordination. En raison du nombre d'approximations faites, la valeur absolue de DSd(M-O) calculée n'a toutefois pas de signification, et seul le signe de DSd(M-O) n'a de sens immédiat. Il permet néanmoins d'attribuer avec plus ou moins de certitude le type de mécanisme suivi, et pour les aqua-ions des métaux de transition il a été montré que le signe de DSd(M-O) correspond à celui du volume d'activation [3,4,32].
Il est d'autre part possible de définir le degré de formation et le degré de rupture des liaisons à l'état de transition pour les mécanismes D et A (respectivement dform et dbreak) de la manière suivante :
Mécanisme D : | |
Mécanisme A : |
où :
Les valeurs ainsi calculées permettent de construire des diagrammes de type More-O' Ferral utiles pour la discussion des mécanismes. Les DV‡cal dépendront de trois facteurs : la magnitude de la liaison normale M-O, le degré de formation ou de rupture de liaison (exprimé par dform ou dbreak) et la distance M O à l'état de transition (dATS ou dDTS).
Ce modèle possède naturellement des limitations, puisque mis à part le fait que les molécules de solvant de la seconde sphère de coordination sont négligées, les effets du solvant et l'influence des contre-ions éventuels ne sont pas pris en compte non plus. Ainsi, l'attribution du mécanisme sur la base des calculs théoriques ne peut être faite de manière certaine que lorsque les changements de structures obtenus par le calcul (exprimés par les DSd[M-O]) se corrèlent aux résultats expérimentaux, de même que lorsque l'énergie d'activation calculée est proche de celle obtenue par l'expérience.
Le paramètre DSd(M-O) décrit les modifications des longueurs de liaison intervenant dans le système pour atteindre l'état de transition et n'est donc qu'une représentation approchée du DV‡. Il faut aussi remarquer que les énergies d'activation DE‡ calculées à l'aide de simulations à l'ordinateur correspondent à des processus ayant lieu en phase gazeuse et à une température de 0 K, alors que le DG‡ correspond à une réaction en solution et à 298 K. Les énergies du point zéro, les capacités calorifiques, les entropies d'activation, les phénomènes de solvatation ainsi que les énergies dues à la formation de liaisons hydrogène devraient donc être prises en compte dans une telle étude. Toutefois, ceci n'a que peu d'importance dans le cas qui nous intéresse, car seules de grandes différences d'énergies (états de transition / produits ou réactifs) sont calculées (le reste étant « petit »).
Approximations mises à part, les calculs théoriques permettent d'obtenir les structures et les énergies des états de transition et des intermédiaires réactionnels impliqués dans les réactions d'échange ou de substitution ; chaque type de mécanisme procèdant naturellement par un état de transition caractéristique. Pour illustrer la méthode proposée par Rotzinger, nous allons reprendre les résultats obtenus par cet auteur pour les hexa-aqua ions de Ti(III), V(II) et Ni(II).
Comme le montrent les figures 4.10 et 4.11, dans le cas du titane(III), l'état de transition a une symétrie C1 et sa fréquence de vibration imaginaire décrit un mouvement de rapprochement du ligand entrant vers le centre métallique. Le calcul du volume molaire partiel des réactants, des états de transition et des intermédiaires est difficile, mais la méthode basée sur le calcul de la différence des sommes de toutes les longueurs de liaison métal-ligands DSd(M-O) entre les états de transitions et le réactant initial a toujours montré une excellente corrélation avec l'expérience [3,4]. Les énergies de ces espèces ainsi que les DSd(M-O) correspondants sont indiquées dans la figure 4.11. Comme il l'a été décrit par Rotzinger, dans cette réaction d'échange, l'entrée du ligand domine sans aucun doute possible le processus d'activation, et le mécanisme peut donc être identifié comme étant de type A. L'intermédiaire [Ti(OH2)5 (OH2)2]3+ est quant à lui caractérisé par des fréquences positives et par une symétrie C1. Le mécanisme devant obéir à la règle de la réversibilité microscopique, l'échange de ligand ne peut donc se faire que si à un moment donné le ligand entrant et le ligand sortant deviennent (symétriquement) équivalents, ainsi, un second état de transition symétrique suit l'intermédiaire sur le chemin réactionnel du titane(III), comme il est montré à la figure 4.11.
En ce qui concerne l' aqua-ion vanadium(II), l'état de transition {[V(OH2)5 (OH2)2]2+}‡ a une symétrie C2 et indique, dans ce cas, un mécanisme de type concerté, comme le confirme l'absence d'intermédiaire réactionnel. Les ligands entrant et sortant sont en effet symétriquement équivalents et non discernables l'un de l'autre. La valeur négative de DSd(M-O) indique, d'autre part, que la formation de liaison à l'état de transition est plus importante que la rupture, ce qui est caractéristique d'un mécanisme concerté possédant un faible caractère (a).
Pour l'échange d'eau sur l'aqua-ion Ni(II), seul un état de transition pour un mécanisme D a pu être calculé et caractérisé par Rotzinger [3,4]. Celui-ci a montré que l'espèce {[Ni(OH2)5 (OH2) (OH2)]2+}‡ a une symétrie Cs dans laquelle les ligands entrant et sortant sont bien discernables l'un de l'autre ; la fréquence de vibration imaginaire montrant principalement un mouvement de départ du ligand sortant. L'intermédiaire réactionnel [Ni(OH2)5 (OH2)2]2+ a quant à lui une symétrie C2v et est une espèce pentacoordonnée pyramidale à base carrée. Le DSd(M-O) calculé indique un mode D, mais selon Rotzinger, un modèle plus précis pourrait toutefois transformer cet intermédiaire en l'état de transition d'un mécanisme Id, la différence d'énergie entre les deux espèces étant très petite [3,4].
Malgré les approximations faites, les résultats que Rotzinger a obtenus à l'aide de son modèle l'ont porté à faire les considérations suivantes : le mécanisme limite dissociatif D est théoriquement envisageable pour tout complexe de métaux de transition, mais il est par contre le seul possible pour les systèmes d6, d7, d8, d9 et d10 à spin haut à cause de la déstabilisation entraînée par l'occupation des orbitales antiliantes (eg*) à l'état de transition [3,4] qui défavorise ainsi l'approche d'une septième molécule d'eau rendant tout mécanisme avec mode d'activation (a) impossible, et surtout favorise la dissociation d'un ligand.
Les calculs ont pu montrer que le mécanisme associatif nécessite la condition que les métaux de transition n'aient pas plus de 7 électrons d (à cause de la nature des orbitales d à l'état de transition hepta-coordonné et de leur occupation) ; ainsi, d'après les calculs de Rotzinger, le Sc(III), le Ti(III) et le V(III) réagissent selon un mécanisme associatif A, alors que le Ni(II), le Cu(II) et le Zn(II) réagissent via un mécanisme dissociatif D ou concerté Id [76,96]. Les éléments 3d du milieu du tableau périodique étant caractérisés par des mécanismes Ia/A et D (ou Id).
En conclusion, on peut donc dire qu'en l'absence de contraintes stériques imposées par des ligands de grande taille, le mécanisme suivi est déterminé principalement par le nombre d'électrons d du métal, et par le mode d'occupation des orbitales t2g et eg* dans le réactant initial [3-4].
Comme il l'a déjà été dit, les réactions d'échange d'eau sur les aqua-ions des métaux de transition di- et trivalents ont été le sujet de multiples études expérimentales [1-2]. Il a ainsi été constaté que pour les ions 3d octaédriques, le mécanisme d'échange passe progressivement d'un mode d'activation Ia à Id avec l'augmentation du nombre d'électrons d et la diminution du rayon ionique.
Ce changement est montré de la manière la plus évidente par le changement de signe du volume d'activation DV‡, et a été confirmé par les études théoriques effectuées par Rotzinger aux niveaux Hartree-Fock et CAS-SCF [3-4]. Comme il l'a été dit, le changement progressif du mécanisme réactionnel ne peut être expliqué uniquement en terme de taille cationique car la configuration électronique joue aussi un rôle important. Pour les complexes octaédriques s, les orbitales t2g sont de nature non-liantes, alors que les orbitales eg* sont anti-liantes. Le remplissage graduel des orbitales t2g situées entre les ligands va défavoriser électrostatiquement l'approche d'une septième molécule vers la face ou l'arrête de l'octaèdre et ainsi diminuer la facilité de former une liaison avec une nouvelle molécule de ligand entrant. De manière similaire, l'augmentation de l'occupation des orbitales eg* pointant vers les ligands va augmenter la tendance à la rupture de liaison, favorisant ainsi les mécanismes D. Les effets électroniques permettent donc d'expliquer cette modification du mode d'activation.
En se basant sur ces arguments, il est alors possible de prédire un mode d'activation dissociatif pour l'échange de molécules d'eau dans les aqua-ions octaédriques (t2g6) à spin bas comme le Ru(OH2)62+, le Rh(OH2)63+ ou encore le Ir(OH2)63+. Dans une première étude du mécanisme de substitution de ligands sur le Ru(OH2)62+ il avait été montré que les constantes de vitesse pour la réaction de substitution d'une molécule d'eau par les anions Cl-, Br- et I- étaient très similaires [5], indiquant ainsi des chemins réactionnels pour atteindre l'état de transition extrêmement proche (c'est à dire la partie concernant la dissociation d'une molécule d'eau). Plus tard, cette étude a été étendue à une large variété de ligands possédant des charges ainsi que des nucléophilicités différentes, et il a été clairement montré que la vitesse de formation du monocomplexe était indépendante de la nature du ligand entrant. Il a alors été attribué au Ru(OH2)62+ un mécanisme Id [6]. Une étude à pression variable de l'échange d'eau sur cet aqua-ion ayant cependant conduit à l'obtention d'un volume d'activation proche de zéro (DV‡ = -0,4 cm3/mol), il a donc été interprété comme étant un mécanisme concerté I sans caractère (a) ou (d) prédominant [7].
Le cas des hexa-aqua ions de rhodium(III) et d'iridium(III) est plus intriguant. Par la méthode de dilution isotopique par 18O (isotope ratio mass spectometer), un mécanisme D avait été attribué pour l'échange d'eau dans le complexe hexa-aquo de rhodium(III) par Plumb et Harris [8] ; la comparaison des constantes de vitesse pour la substitution d'une molécule d'eau par un anion Cl- ou Br- ayant validé ces observations par le même Harris [80]. Cependant, il y a quelques années, Merbach et collaborateurs ont obtenu, par des techniques de RMN haute pression sur l'oxygène 17O, un volume d'activation négatif pour l'échange d'eau sur le Rh(OH2)63+ (DV‡ = -4,2 cm3/mol) [9], et un volume plus négatif encore pour l'aqua-ion iridium(III), Ir(OH2)63+ (DV‡ = -5,7 cm3/mol) [10]. Ils en ont alors conclu que dans les deux cas un mécanisme concerté à faible caractère (a), a lieu.
Ces deux attributions mécanistiques ont été remises en question par Richens. Il a été suggéré que dans le cas du Ru(OH2)62+ le volume d'activation proche de zéro peut être dû à une contraction des liaisons des cinq ligands spectateurs pour atteindre l'état de transition dans un processus Id [11-12]. Poursuivant ce raisonnement, Richens a proposé que dans le cas du rhodium(III), la charge posit4e plus élevée du métal pouvait produire une grande contraction de volume dans l'état de transition, suffisante pour changer le signe du volume d'activation et le rendre ainsi négatif [12], et cet effet devrait être encore plus marqué pour l'iridium(III). Selon cet auteur, l'interprétation du mécanisme selon un mode Ia aurait alors été fausse, un mécanisme limite D étant en fait à l'oeuvre (avec un DV‡ expérimental mesuré négatif).
En supposant qu'une telle hypothèse était vraie, ces deux cas montreraient les limites de l'utilisation du volume d'activation comme critère diagnostique du mécanisme d'échange suivi.
Le but de ce travail de recherche, mené en collaboration avec F. Rotzinger et A. Merbach, était donc de résoudre cette énigme en étudiant théoriquement les mécanismes d'échange d'eau sur les hexaaqua ions de rhodium(III) et d'iridium(III) à l'aide du modèle développé avec succès par le même Rotzinger.
Comme il va l'être vu, les résultats présentés ci-après et l'étude successive de Richens et de ses collaborateurs [100] sur la substitution d'anions Br- sur l'aqua-ion Rh(OH2)63+ a entre-temps permis de confirmer les conclusions de Merbach et de ses collaborateurs, et le même Richens a revu son hypothèse au sujet du volume d'activation.
Selon la méthode proposée par Rotzinger [3,4] pour élucider le mécanisme d'échange suivi, il faut étudier les différents mécanismes possibles (A, D ou I) à l'aide de structures de départ hexa-coordonnées ; une molécule d'eau additionnelle de la seconde sphère de coordination devant être ajoutée, selon le mécanisme que l'on souhaite étudier. Après avoir obtenu et caractérisé les différentes espèces chimiques sur les chemins réactionnels, les variations des distances DSd(M-O) sont analysées et les énergies d'activation sont alors comparées afin de déterminer le mécanisme préféré.
Afin de localiser l'état de transition d'un mécanisme réactionnel donné, Rotzinger conseille de partir d'un réactant hexa-aquo [M(OH2)6]n+ ou de l'« adduit » [M(OH2)6OH2]n+ (ayant toutes les fréquences de vibration réelles) et de sélectionner dans le complexe une liaison M-O qui va être variée (allongement ou compression) afin de simuler le mécanisme réactionnel, en optimisant à chaque variation les liaisons restantes. La structure de départ ne doit pas avoir une symétrie trop élevée (C1 ou Cs), et les optimisations de géométrie sont effectuées avec cette contrainte sur l'une des liaisons, jusqu'à ce que les gradients soient < 0,005 hartree/bohr. La structure remplissant cette condition est alors soumise à un calcul des fréquences de vibration afin de déterminer s'il s'agit bien d'un état de transition (une seule fréquence imaginaire), puis optimisée en tant qu'état de transition.
Pour l'étude de mécanismes de type associatif ou concerté, Rotzinger propose d'utiliser des adduits à sept molécules d'eau pour les réactifs (et les produits). Dans le cas d'un mécanisme limite A, l'état de transition est caractérisé par l'approche du ligand entrant plus que par le départ du ligand sortant, alors que dans le cas d'un mécanisme concerté les deux phénomènes seront équivalents (les mécanismes Id/Ia différant cependant par le degré de formation des liaisons). Les mécanismes concertés seront, d'autre part, caractérisés par l'absence de tout intermédiaire réactionnel, contrairement aux mécanismes A ou D.
Les espèces caractérisant les chemins réactionnels d'un mécanisme A et d'un mécanisme I seront :
Dans un mécanisme limite dissociatif D, le réactant sera simplement le complexe octaédrique, et le mécanisme passera par un état de transition où le métal sera penta-coordonné. Rotzinger a montré que dans le cas d'un tel mécanisme l'influence de la molécule d'eau se trouvant dans la seconde sphère d'hydratation peut être négligée. En effet, l'ajout de cette molécule ne modifie pas le mécanisme D en un mécanisme Id, et celle-ci peut donc être omise lors des calculs (les états de transition sont identiques avec et sans la septième molécule d'eau supplémentaire, en particulier pour les longueurs de liaison du groupe partant). Pour un mécanisme de type D on aura alors :
L'état de transition pour ce mécanisme sera caractérisé par une fréquence de vibration imaginaire montrant l'une des six liaisons M-L s'allongeant (les cinq autres restant approximativement inchangées), ce qui correspond au mouvement de départ du ligand partant.
Comme il l'a déjà été dit, dans le cas d'un mécanisme dissociatif, la septième molécule d'eau ajoutée ne modifie quasiment pas les six liaisons M-O restantes, mais par contre la présence de cette molécule supplémentaire pour les études des mécanismes A ou I est fondamentale (à cause de la possibilité de former des liaisons hydrogène).
Il faut noter que les mécanismes de type « concerté », I, sont parfois compliqués à décrire puisqu'ils occupent une position intermédiaire entre le mécanisme limite associatif et le mécanisme limite dissociatif. Il est en outre souvent difficile de distinguer un mécanisme limite D d'un mécanisme Id, surtout si la différence d'énergie entre l'état de transition et l'intermédiaire est faible. Dans le cas du Ni(OH2)62+OH2, par exemple, Rotzinger a montré que la fréquence imaginaire de l'état de transition correspondait à l'élongation de la liaison entre le métal et le groupe partant ; la distance avec la molécule se trouvant dans la seconde sphère de coordination ne variant pratiquement pas (état de transition dominé par le départ du ligand) [3-4]. Il en a donc déduit que le mécanisme calculé était de type D, voire Id ; les limitations du modèle ne permettant pas une distinction plus précise.
Le mécanisme d'échange d'eau dans la première sphère de coordination des aqua-ions Rh(III) et Ir(III) a été étudié à l'aide de programmes de chimie quantique. Les chemins réactionnels impliquant six ou sept molécules d'eau ont été considérés : les structures obtenues conduisant à un point stationnaire sur la surface d'énergie potentielle (réactants/produits, états de transition ou encore intermédiaires réactionnels) ont été caractérisées et analysées à chaque fois afin de pouvoir les comparer avec les données expérimentales [10] (en particulier avec les enthalpies d'activation DH‡ ou DG‡ et le volume d'activation DV‡).
Tous les calculs ont été effectués sur des stations de travail SGI avec les programmes GAMESS [13] et GAUSSIAN 98 [14]. Les fonctions développées par Stevens et collaborateurs [15] ont été utilisées pour le rhodium et l'iridium, dans lesquelles les orbitales de coeur du métal sont représentées par des potentiels relativistes, les fonctions demi-coeur s,p/s,p sont de type double-z et les fonctions nd sont de type triple-z. Pour l'oxygène et l'hydrogène, les fonctions 6-31G [16,17] avec une fonction de polarisation 3d additionnelle (ad (O) = 1,20) ont été employées [18]. Les optimisations, en particulier la localisation des états de transition, ont été effectuées à l'aide de la méthode proposée et décrite par Rotzinger [3,4].
Le niveau de calcul a été limité au niveau Hartree-Fock pour les espèces de rhodium(III) et d'iridium(III), des études précédentes ayant montré que ce niveau de calcul menait à des résultats pleinement satisfaisants [3,4]. Ceci a permis d'obtenir et de caractériser, dans les deux cas, deux mécanismes d'échanges : l'un à six molécules d'eau, l'autre à sept molécules d'eau.
Les géométries des réactants, des états de transition, ainsi que des intermédiaires réactionnels optimisées au niveau Hartree-Fock en phase gazeuse ont ensuite été ré-optimisées en phase solvatée à l'aide du modèle proposé par Onsager et collaborateurs (Self-Consistent Reaction Field, SCRF) implémenté dans le programme GAMESS [13,20,21]. Pour les calculs SCRF, le rayon pour la cavité du solvant a été approximé comme valant la moitié de la distance interatomique maximale (dH-H max) plus les deux rayons de Van der Waals (1,2 Å pour l'atome d'hydrogène). Une fois la géométrie convergée vers un minimum, le rayon de la cavité a été recalculé avec la nouvelle valeur dH-H max et l'optimisation a été répétée. Cette procédure a été stoppée lorsque le rayon calculé pour la cavité ne différait plus que de 0,01 Å de la valeur précédente.
Les énergies de ces espèces ont finalement été recalculées à l'aide des modèles PCM et CPCM (Polarizable Continuum Models) [21-26], car les énergies d'activation calculées de cette manière sont plus précises et en général plus proches des valeurs expérimentales que celles obtenues à l'aide du modèle SCRF (ce modèle implique en effet une cavité de solvant sphérique, ce qui constitue parfois une approximation trop simpliste).
Les étapes clé de ce long travail sont résumées en détail dans les paragraphes ci-après. Une partie des résultats concernant l'échange d'eau sur l'hexa-aqua ion de Ru(II) obtenus en collaboration avec le Dr. H. Sidorenkova est aussi présentée afin de compléter l'étude par la comparaison de cet ion iso-électronique avec le rhodium(III), et essayer de comprendre l'origine de la différence mécanistique entre ces deux aqua-ions t2g6. A noter que pour le ruthénium(II) seul un mécanisme à six molécules d'eau a pu être obtenu et caractérisé au niveau Hartree-Fock ; des études supplémentaires à l'aide de méthodes plus poussées ont en outre montré que les niveaux de calcul MP2 et CAS-SCF ne permettent pas d'obtenir un état de transition hepta-coordonné pour cet aqua-ion avec le modèle utilisé.
Rotzinger ayant montré à plusieurs reprises que les études de mécanismes D sur les complexes hexa-aquo ne nécessitent pas l'ajout d'une septième molécule d'eau [3,4], le travail a donc débuté par l'optimisation d'un réactant avec le métal entouré de six molécules d'eau uniquement (dénommé par la suite « GS »). L'idée étant ensuite de modifier la distance de liaison entre le rhodium et l'une des molécules d'eau (Rh-O6) dans le but de simuler un mécanisme D (« manuellement »), en observant les modifications de géométrie des ligands restants (influence sur les longueurs de liaison et sur les angles de valence) pour essayer d'identifier un état de transition, TS, et un intermédiaire réactionnel, et pouvoir ensuite calculer l'énergie d'activation DE‡ en résultant.
La distance entre le rhodium et l'oxygène de la molécule H2O(6) a successivement été allongée (en optimisant les paramètres géométriques restants et en maintenant une symétrie Cs, figure IV.13), et l'évolution de l'énergie obtenue a permis de localiser approximativement un état de transition possible pour une distance Rh-O6 valant 3,4 Å et un intermédiaire réactionnel à une distance de 3,97 Å (figure IV.14.a).
Les figures IV.14 indiquent les variations des distances Rh-O1 équatoriale et Rh-O3 axiale à l'état de transition. La distance Rh-O1 augmente avec l'élongation de la molécule d'eau active Rh-O6 dans la première partie de la courbe, puis diminue brusquement à l'état de transition. La distance Rh-O3 axiale diminue régulièrement avec l'élongation de la distance avec la molécule d'eau active et une brusque variation est observée (petite diminution et augmentation) juste avant l'état de transition. L'évolution régulière de ces deux distances est donc stoppée juste avant l'état de transition et un raccourcissement a lieu dans les deux cas montrant que la dissociation de la molécule d'eau active provoque effectivement un raccourcissement des liaisons restantes, mais que celui-ci n'est pas très grand (la distance Rh-O1 passe de 2,076 à 2,071 Å !).
La représentation du gradient de l'énergie a permis de se faire une idée approximative sur la position de l'état de transition et de l'intermédiaire sur le chemin réactionnel obtenu (les points stationnaires correspondant à un gradient nul). La figure IV.15 indique en effet deux points intéressants : l'un à une distance Rh-O6(H2) valant ~ 3,4 Å et l'autre à une distance valant 3,8 Å. L'état de transition peut être localisé précisément, en utilisant la méthode dite du 'eigenvector following' qui consiste à suivre le mode de vibration imaginaire afin de localiser le point de selle sur la surface d'énergie potentielle correspondant à l'espèce recherchée (TS), en partant de la géométrie approchée.
La structure obtenue pour une distance de liaison Rh-O6 valant 3,4 Å a donc été utilisée comme point de départ pour la recherche de l'état de transition, puisque d'après la courbe d'énergie celui-ci semble être le point le plus haut en énergie du chemin réactionnel étudié. L'optimisation a confirmé cette hypothèse car un point de selle a été obtenu pour une distance valant 3,44 Å (avec une symétrie de type Cs). Le calcul successif des fréquences de vibration a mis en évidence une fréquence imaginaire (à 74i cm-1), correspondant à un mode indiquant le départ de la molécule d'eau active dans la première sphère de coordination, et a permis de confirmer que la structure obtenue correspondait à un état de transition caractéristique d'un mécanisme D.
Fréquences de vibration74i cm-1 / 52 cm-1 / 138 cm-1 / 151 cm-1 / 156 cm-1 / 165 cm-1 / 184 cm-1 / 199 cm-1 / 201 cm-1 / 212 cm-1 / 248 cm-1 / 289 cm-1 / 301 cm-1 / 328 cm-1 / 349 cm-1 / 421 cm-1 / 454 cm-1 / 475 cm-1 / 476 cm-1 / 484 cm-1 / 490 cm-1 / 530 cm-1 / 551 cm-1 / 556 cm-1 / 561 cm-1 / 565 cm-1 / 674 cm-1 / 792 cm-1 / 801 cm-1 / 838 cm-1 / 854 cm-1 / 990 cm-1 / 1108 cm-1 / 1773 cm-1 / 1844 cm-1 / 1854 cm-1 / 1860 cm-1 / 1870 cm-1 / 1890 cm-1 / 3075 cm-1 / 3864 cm-1 / 3884 cm-1 / 3891 cm-1 / 3907 cm-1 / 3941 cm-1 / 3955 cm-1 / 3963 cm-1 / 3965 cm-1 / 3970 cm-1 / 3990 cm-1 / 4057 cm-1 |
Après avoir optimisé avec succès (en symétrie Cs) la structure pour la distance Rh-O6 proche de 3,8 Å fournie par l'étude du gradient de l'énergie, le calcul des fréquences a montré que la structure obtenue correspondait effectivement à un minimum d'énergie local sur le chemin réactionnel (fréquences de vibration toutes positives), représentant ainsi un intermédiaire réactionnel.
Fréquences de vibration26 cm-1 / 54 cm-1 / 151 cm-1 / 152 cm-1 / 158 m-1 / 161 cm-1 / 164 cm-1 / 186 cm-1 / 204 cm-1 / 206 cm-1 / 214 cm-1 / 255 cm-1 / 293 cm-1 / 302 m-1 / 341 cm-1 / 446 cm-1 / 446 cm-1 / 468 cm-1 / 483 cm-1 / 492 cm-1 / 519 cm-1 / 525 cm-1 / 543 m-1 / 548 cm-1 / 562 cm-1 / 575 cm-1 / 612 cm-1 / 790 cm-1 / 795 cm-1 / 836 cm-1 / 849 cm-1 / 984 m-1 / 1324 cm-1 / 1790 cm-1 / 1843 cm-1 / 1853 cm-1 / 1858 cm-1 / 1866 cm-1 / 1873 cm-1 / 2098 cm-1 / 3867 cm-1 / 3888 cm-1 / 3894 cm-1 / 3910 cm-1 / 3944 cm-1 / 3960 cm-1 / 3966 cm-1 / 3969 m-1 / 3986 cm-1 / 3999 cm-1 / 4072 cm-1. |
Si l'on étudie les deux structures obtenues, on voit que la distance entre l'oxygène O6 de la molécule d'eau partante et l'hydrogène H10 proche vaut 1,595 Å pour l'état de transition, ce qui permet la formation d'une liaison hydrogène stabilisante (figure IV.17). L'angle O3-H10-O6 ne vaut toutefois pas 180°, comme on pourrait le penser, mais 152,6°. L'intermédiaire réactionnel est, par contre, caractérisé par un angle O3-H10-O6 de 180° (avec une distance O6-H10 valant 1,420 Å). Ce phénomène provient du fait que l'angle O3-H10-O6 s'ouvre durant départ de la molécule d'eau active, et que celui-ci n'est pas encore complété à l'état de transition.
La vibration de la liaison O-H impliquée dans la liaison hydrogène est caractérisée par une fréquence valant 2098 cm-1 pour l'intermédiaire réactionnel, alors qu'elle vaut 3075 cm-1 pour l'état de transition. La molécule d'eau est en fait impliquée dans ce cas dans une double liaison hydrogène : métal central et H2O équatoriale.
Les énergies obtenues pour l'état de transition ainsi que pour l'intermédiaire réactionnel correspondent à celles mises en évidence par le (pseudo) chemin réactionnel préalablement obtenu manuellement (courbe de l'évolution de l'énergie en fonction de la distance Rh-O6) et ceci confirme que les deux espèces sont caractéristiques de ce chemin. Il est finalement possible d'en tirer les différents paramètres thermodynamiques :
DE‡ (Etat de transition-Réactant) = 136,62 kJ/mol
DE (Etat de transition-Intermédiaire) = - 3,14 kJ/mol
En utilisant la méthode proposée par Rotzinger basée sur la différence des longueurs de liaison, il est possible d'évaluer si l'édifice moléculaire augmente ou diminue de volume à l'état de transition. Les différents paramètres géométriques et énergétiques sont ainsi résumés dans la table IV.2.
Les résultats présentés dans la table IV.2 semblent indiquer que le volume moléculaire augmente lorsque l'on passe de l'état initial à l'état de transition, et il continue d'augmenter en allant vers l'intermédiaire, ce qui avait déjà été mis en évidence par Rotzinger [4] ; ceci provient de ce que la réaction d'échange (le départ de la molécule d'eau) n'est pas encore complétée à l'état de transition. Le signe de DSd(M-O) obtenu (1,27 Å) est tout à fait en accord avec un mécanisme de type dissociatif, ce qui confirme la validité du modèle utilisé, mais va dans le sens contraire de la contraction de volume montrée par le signe du DV‡ expérimental. Il faut encore noter que la différence d'énergie entre l'état de transition et l'intermédiaire réactionnel est faible dans ce cas.
Il existe d'autres méthodes qui permettent d'évaluer le volume d'activation par le calcul ; celles-ci ont été testées afin de les comparer à la méthode des DSd(M-O). Il faut ici rappeler que le critère proposé par Rotzinger n'est qu'une représentation de l'expansion (ou de la contraction) du complexe à l'état de transition, et ne permet que de reproduire le signe de DV‡, mais pas sa valeur absolue. Celui-ci s'est révélé en général capable de reproduire assez bien le signe du volume d'activation [3-4], mais une étude combinée de Rotzinger et de Merbach [32] a montré une très bonne corrélation avec l'expérience pour des volumes obtenus à l'aide de la méthode basée sur la détermination de la surface de Connolly [43] (avec un étalonnage sur les résultats expérimentaux obtenus pour Al3+ afin d'évaluer le DV‡ de la réaction d'échange de l'indium(III) pas connu expérimentalement).
Le programme de visualisation « Molekel » [97,98] permet d'évaluer le volume moléculaire sur la base du calcul de la surface de Connolly ; celle-ci étant générée en faisant rouler une molécule de solvant (par défaut de l'eau) sur l'édifice moléculaire. Le volume est alors évalué à partir d'une iso-surface divisée en petits éléments triangulaires ; la précision dépendant naturellement de la résolution de la grille de points utilisée.
La surface de Connolly a été évaluée dans notre cas en utilisant trois différents sets de valeurs pour les rayons atomiques des atomes d'oxygène et d'hydrogène. La méthode indiquée par [a] utilise les valeurs des rayons de Van der Waals par défaut de Molekel (1,52 Å pour l'oxygène et 1,20 Å pour l'hydrogène); la méthode indiquée par [b] utilise des rayons de Van der Waals modifiés pour ces deux atomes (1,88 Å et 1,23 Å respectivement), la méthode indiquée par [c] fait intervenir un facteur de scaling de 1,254 appliqué au rayon de Van der Waals des atomes d'oxygène et néglige le rayon de Van der Waals des atomes d'hydrogène.
D'autre part, une méthode alternative et plus rigoureuse, basée sur la distribution de la densité électronique, a été proposée par Bader et collaborateurs ; ceux-ci ont montré que des surfaces à isodensité électronique valant 0,001 et 0,002 a.u. (1 a.u. = 6,748 e-/Å3) décrivent en général correctement la taille ainsi que la forme de la molécule en phase gazeuse et en phase condensée [43,44]. La densité électronique prise à un cutoff de 0,001 a.u. tient compte approximativement du 98 % de la densité totale de la molécule et cette valeur a été choisie pour l'évaluation du volume moléculaire dans notre cas (méthode indiquée par [d]). Les résultats de toutes les méthodes testées et des différents paramètres utilisés sont indiqués dans la table IV.3.
Tabl. 4.3 : Résumé des résultats obtenus pour le mécanisme D à l'aide de différentes méthodes d'évaluation du volume et de divers paramètres.
On constate que les valeurs obtenues dépendent fortement de la manière dont le volume moléculaire est calculé, mais que le signe du DV‡ est toujours positif. Cette étude complémentaire a permis de montrer qu'il est difficile de choisir une méthode pour l'estimation du volume adéquate, mais dans le cas du rhodium(III), le fait que le signe du DV‡ expérimental ne puisse jamais être reproduit a clairement indiqué la nécessité de rechercher un autre mécanisme (A ou I) en introduisant une molécule d'eau de la seconde sphère de coordination (adduit de départ hepta-coordonné) pour son étude ; la faible différence d'énergie calculée entre l'état de transition et l'intermédiaire semblant en effet pencher en faveur d'un mécanisme de type concerté.
Des études menées par Rotzinger ont par ailleurs montré que pour le complexe aquo-pentaamine de rhodium(III) le mécanisme d'échange suivi est Id [105], à cause de la formation de liaisons hydrogène faibles. L'étude d'un système impliquant une molécule d'eau de la seconde sphère de coordination a donc été entreprise, avec comme réactant de départ un adduit Rh(OH2)6OH23+.
Comme il l'a déjà été dit, en ajoutant une molécule d'eau de la seconde sphère de coordination, il est possible d'étudier des mécanismes associatif ou concerté ; ceci en partant d'un « adduit » à sept molécules d'eau comme réactif de départ. Il a été effectué une première optimisation de la structure de l'adduit à l'aide de la base de taille réduite 3-21G, puis une optimisation plus fine a été faite en utilisant les même bases et le même niveau de calcul que celui utilisé pour l'étude du mécanisme D à six molécules d'eau (voir paragraphe précédent).
Le calcul des fréquences de vibration de la structure ainsi obtenue a montré que celle-ci correspondait effectivement à un point stationnaire (minimum d'énergie).
Fréquences de vibration24.4 cm-1 / 112.4 cm-1 / 141.9 cm-1 / 143.9 cm-1 / 151.6 cm-1 / 167.8 cm-1 / 172.1 / 179.3 cm-1 /191.6 cm-1 / 197.2 cm-1 / 214.8 cm-1 / 225.6 cm-1 / 234.7 cm-1 / 255.2 cm-1 / 273.3 cm-1 / 320.1 cm-1 / 335.4 cm-1 / 367.99 cm-1 / 426.5 cm-1 / 440.4 cm-1 / 441.4 cm-1 / 447.5 cm-1 / 460.8 cm-1 / 468.5 cm-1 / 486.4 cm-1 / 496.9 cm-1 / 507.8 cm-1 / 527.3 cm-1 / 532.6 cm-1 / 549.5 cm-1 / 722.4 cm-1 / 762.1 cm-1 / 782.7 cm-1 / 788.3 cm-1 / 807.1 cm-1 / 827.9 cm-1 / 910.98cm-1 / 940.1 cm-1 / 975.8 cm-1 / 1839.4 cm-1 / 1854.3 cm-1 / 1858.0 cm-1 / 1863.8 cm-1 / 1864.3 cm-1 / 1874.6 cm-1 / 1913.1 cm-1 / 3530.1 cm-1 / 3623.7 cm-1 / 3926.2 cm-1 / 3928.98 cm-1 / 3932.8 cm-1 / 3946.6 cm-1 / 3972.4 cm-1 / 3989.8 cm-1 / 3996.9 cm-1 / 4000.9 cm-1 / 4002.9 cm-1 / 4006.6 cm-1 / 4010.3 cm-1 / 4039.9 cm-1. |
D'après Rotzinger, on peut s'attendre à ce que la répulsion de Pauli, importante pour les systèmes (t2g6), empêche la molécule d'eau supplémentaire de s'approcher du métal central, ce qui implique qu'un état de transition peut éventuellement ne pas être obtenu pour les mécanismes associatif ou concerté passant par l'état électronique fondamental [4]. De plus, la stabilisation produite par la formation des liaisons hydrogène étant très forte, il faut la limiter au maximum afin de faire sortir la molécule de la seconde sphère d'hydratation du minimum d'énergie dans lequel elle se trouve.
Pour cette étude, bien qu'il ait été essayé d'utiliser une procédure analogue à celle utilisée pour l'obtention du mécanisme à six molécules d'eau, aucun chemin correct n'a pu être obtenu en essayant de simuler le chemin réactionnel (approche manuelle de la molécule se trouvant dans la seconde sphère afin de reproduire un mécanisme associatif ou concerté).
L'obtention d'un état de transition ayant posé passablement de problèmes, il a alors été tenté de le localiser en partant de la structure de l'état de transition obtenue par Rotzinger pour le cas similaire du vanadium(II) qui est caractérisé par un mécanisme d'échange Ia. Les coordonnées correspondant à l'état de transition du vanadium(II) [3-4] ont donc été utilisées comme point de départ, en modifiant cependant de manière adéquate les distances Rh-O (» 2,08 Å) et en fixant la distance Rh O7 à 3,1 Å.
L'optimisation de cette espèce a été effectuée en symétrie C2 avec, comme contraintes, la distance Rh-O7 ainsi que l'angle de torsion formé avec l'oxygène O7 et les ligands équatoriaux O2, O4 et O5 maintenus fixes. Cette optimisation avec contraintes a conduit à l'obtention d'une structure approchée pour l'état de transition, structure qui a ensuite été affinée et qui a finalement été caractérisée par le calcul des fréquences de vibration (figure IV.21). Celui-ci a permis de mettre en évidence le fait que le mode vibrationnel correspondant à la fréquence imaginaire montre un mouvement concerté des molécules d'eau entrante et sortante Rh-OH2(6) et Rh-OH2(7) (symétriquement distantes de 2,7 Å du rhodium), ainsi que leur indiscernabilité, ce qui est caractéristique d'un mécanisme concerté I.
La structure de l'adduit de départ a ensuite été recherchée en variant la distance de l'une des deux molécules actives (Rh-O7) par rapport au centre métallique (figure IV.22), en utilisant la structure de l'état de transition comme point de départ. Cette molécule d'eau a donc été éloignée afin de la faire repasser dans la seconde sphère de coordination et arriver ainsi à l'adduit initial (dénommé « GS »).
Lorsque la molécule d'eau « active » H2O(7) s'éloigne du centre métallique, l'autre molécule H2O(6) s'en approche, car à l'état de transition, la molécule d'eau H2O(7) active est suffisamment proche de la molécule d'eau H2O(6) pour qu'une liaison hydrogène puisse se former entre les deux (le mouvement des deux molécules est alors couplé comme le montre le mode de vibration imaginaire caractérisant l'état de transition). Ceci explique pourquoi la molécule d'eau H2O(6) reprend une position axiale dans le complexe lorsque la molécule H2O(7) s'éloigne du centre métallique pour repasser dans la seconde sphère de coordination afin de reformer l'adduit.
Le graphique présenté dans la figure IV.22 correspond grossièrement au chemin réactionnel de la réaction d'échange et montre qu'il s'agit d'un mécanisme de type concerté car il n'y a pas d'intermédiaire réactionnel dans ce cas. La distance Rh-O7 correspondant à l'adduit de départ a ainsi été localisée à 3,8 Å. De plus, grâce à la représentation de l'évolution du gradient il a été possible de vérifier la position de l'état de transition à 2,7 Å sur le chemin réactionnel (le gradient de l'énergie étant nul en ce point ; figure IV.23).
Après avoir obtenu une géométrie approchée de l'adduit de départ, celle-ci a été optimisée et caractérisée à l'aide du calcul des fréquences de vibration. L'analyse de la géométrie a finalement montré qu'il s'agissait de la structure obtenue au début de cette étude.
Pour terminer, un calcul « IRC », consistant à suivre le chemin réactionnel selon la coordonnée de réaction afin de relier l'état de transition (TS) à la structure de départ (GS) a été effectué en partant de la structure de l'état de transition obtenu. L'optimisation du dernier point fournit par le calcul IRC a convergé vers un point stationnaire (ce qui a été confirmé par le calcul des fréquences de vibration, toutes positives), ce point stationnaire correspondant effectivement à l'adduit de départ présenté au début (figure IV.24).
Il a donc été montré que les deux espèces obtenues (GS et TS) sont reliées l'une à l'autre et font partie du même chemin réactionnel. Les énergies ainsi que les paramètres géométriques en sont résumés dans les tables IV.4 et IV.5 ci-après. L'absence d'intermédiaire réactionnel indique que le mécanisme suivi est du type concerté I ; le mode d'activation restant encore à déterminer.
Ce qui donne alors :
DE‡ (Etat de transition-Réactant) = 134,6 kJ/mol
On peut constater que toutes les méthodes (mis à part celle de la densité électronique) conduisent à des valeurs négatives pour le DV‡ estimé par calcul, ce qui correspond au signe du DV‡ expérimental.
Afin d'inclure les effets du solvant sur les mécanismes d'échange obtenus, des calculs additionnels ont été effectués à l'aide de modèles incluant les effets de solvatation (SCRF, PCM et CPCM) [21-26]. A cause de problèmes liés à la paramétrisation du modèle PCM, il a été choisi, dans ce travail, de ne ré-optimiser les structures obtenues en phase gazeuse qu'avec le modèle SCRF, puis de calculer les énergies PCM et CPCM à ces géométries là.
L'ajout des effets de solvatation a permis de confirmer que ceux-ci ne modifient que très peu les distances de liaison pour les complexes hexa-aquo [32], mais ils rendent l'énergie d'activation plus proche encore de la valeur expérimentale (voir table IV.8).
Tous les résultats obtenus sont résumés dans la table IV.8 ci-après, en adoptant la numérotation indiquée dans la figure IV.25. La faible valeur négative de DSd(Rh-O) obtenue pour le mécanisme énergétiquement favorisé, ainsi que le mode de vibration imaginaire caractérisant l'état de transition indiquent que le mode d'activation est plutôt associatif, et le mécanisme d'échange suivi est donc Ia.
Dans le cas du complexe hexa-aquo de l'iridium(III), le niveau de calcul Hartree-Fock n'est, à priori, pas suffisant pour l'étude des mécanismes d'échange, ceci à cause de la présence d'effets relativistes et de la corrélation électronique plus forte pour les métaux de transition des périodes profondes. Il a donc été tenté, dans un premier temps, d'utiliser les techniques DFT du programme « GAUSSIAN » (version 98). Malgré les nombreuses bases et fonctionnelles testées, les tentatives n'ont cependant pas permis d'obtenir un état de transition ou un intermédiaire réactionnel, et seuls les réactants de départ ont pu être identifiés (aqua-ion Ir(OH2)63+ et adduit Ir(OH2)6(OH2)3+).
Les mêmes modèles et niveaux de calcul que ceux utilisés pour l'étude de l'aqua-ion rhodium(III) ont alors été repris (bases identiques et niveau de calcul Hartree-Fock), pour les raisons précédemment expliquées [3,4]. Ceci a amené à l'obtention de deux chemins réactionnels similaires à ceux obtenus dans le cas du rhodium(III), et l'identification successive des espèces les caractérisant a conduit à des résultats satisfaisants ; ceux-ci sont présentés ci-après.
D'où on en tire finalement les différences d'énergie suivantes pour le mécanisme D :
DE‡ (Etat de transition-Réactant) = 146,14 kJ/mol
DE (Etat de transition-Intermédiaire) = - 3,06 kJ/mol
D'après les tables IV.9, on constate que le signe de DSd(Ir-O) est positif pour le mécanisme à six molécules d'eau, contrairement au signe du DV‡ expérimental. La différence d'énergie entre l'intermédiaire réactionnel et l'état de transition est d'autre part très faible (état de transition et intermédiaire semblant se confondre), et ceci suggère que le mécanisme pourrait à nouveau être de type concerté, comme c'est le cas pour le rhodium(III), ce qui a successivement été étudié (tables IV.10).
On en tire finalement pour le mécanisme I :
DE‡ (Etat de transition-Réactant) = 144,59 kJ/mol
Les résultats montrent que le mécanisme à sept molécules d'eau est énergétiquement favorisé par rapport au mécanisme D à six molécules d'eau (144,6 kJ/mol contre 146,1 kJ/mol). D'autre part, l'absence d'intermédiaires réactionnels, le signe négatif, ainsi que la valeur très faible de DSd(Ir-O) indiquent un mécanisme de type I, voire Ia, et confirment les résultats expérimentaux obtenus par Merbach et collaborateurs [10].
Les effets de solvant ont ensuite été ajoutés à l'aide du modèle de Onsager (SCRF) ainsi que des modèles PCM/CPCM afin de valider ces observations, et les résultats en sont résumés ci-après.
Ce qui nous donne ainsi :
DE‡ (Etat de transition-Réactant) = 256,43 kJ/mol kJ/mol
DE (Etat de transition-Intermédiaire) = 59,09 kJ/mol kJ/mol
On voit que l'effet stabilisant du solvant provoque une forte augmentation de DE‡ pour le mécanisme D, de même que croit l'écart d'énergie entre l'intermédiaire et l'état de transition. On peut cependant constater que la valeur de DE‡ obtenue par le calcul SCRF est anormalement grande (256 kJ/mol), de même que l'intermédiaire semble être moins stable que l'état de transition ! Ces artefacts proviennent de problèmes liés au modèle qui montre ses limites dans ce cas.
Ce qui nous donne alors pour le mécanisme I :
DE‡ (Etat de transition-Réactant) = 37,67 kJ/mol kJ/mol
On peut une nouvelle fois remarquer que les énergies obtenues à l'aide du modèle SCRF pour ces espèces ne sont pas satisfaisantes. L'approximation sphérique de ce modèle n'est en effet suffisamment précise que pour des complexes de symétrie octaédrique (globalement comparable à une sphère), ce qui n'est pas le cas de l'état de transition ou de l'intermédiaire. Cela se constate facilement en observant la table IV.13 : de manière similaire aux espèces du rhodium(III), l'intermédiaire réactionnel semble être moins stable que l'état de transition, ce qui n'est pas possible !
Enfin, comme l'indique la table IV.13, les énergies PCM/CPCM calculées à l'aide du programme « GAUSSIAN 98 » aux géométries SCRF ne semblent pas correctes pour le chemin à sept molécules d'eau. Ces même énergies ont donc été recalculées à l'aide du programme « GAMESS ». Il est à rappeler que seules les énergies ont été calculées à l'aide de ce modèle. Les résultats obtenus pour les deux mécanismes, à six et à sept molécules d'eau, sont récapitulés dans les tables ci-après.
En conclusion, les calculs montrent que de manière similaire au rhodium(III), le mécanisme concerté pour l'iridium(III) est encore plus favorisé par rapport au mécanisme dissociatif avec l'ajout des effets de solvatation.
Comme il va l'être dit dans la partie discussion ci-après, les présents calculs ont permis de montrer que les deux aqua-ions Rh(III) et Ir(III) ont un comportement très similaire et sont tous deux caractérisés par un mécanisme d'échange d'eau concerté I énergétiquement favorisé par rapport à un mécanisme D, ce qui confirme les observations expérimentales.