Cela permet de fournir une façon intuitive d'utiliser les interfaces de vos classes aux utilisateurs. De plus, cela permet aux templates
de travailler de la même façon avec les classes et les types de base.
La surcharge d'opérateur permet aux opérateurs du C++ d'avoir une signification spécifique quan ils sont appliqués à des types
spécifiques. Les opérateurs surchargés sont un "sucre syntaxique" pour l'appel des fonctions :
class Fred {
public:
...
};
#if 0
// Without operator overloading:
Fred add(const Fred& x, const Fred& y);
Fred mul(const Fred& x, const Fred& y);
Fred f(const Fred& a, const Fred& b, const Fred& c)
{
return add(add(mul(a,b), mul(b,c)), mul(c,a)); // Yuk...
}
#else // With operator overloading:
Fred operator+ (const Fred& x, const Fred& y);
Fred operator* (const Fred& x, const Fred& y);
Fred f(const Fred& a, const Fred& b, const Fred& c)
{
return a*b + b*c + c*a;
}
#endif
Surcharger les opérateurs standards permet de tirer parti de l'intuition des utilisateurs de la classe. L'utilisateur va en effet
pouvoir écrire son code en s'exprimant dans le langage du domaine plutôt que dans celui de la machine.
Le but ultime est de diminuer à la fois le temps d'apprentissage et le nombre de bugs.
Parmi les nombreux exemples que l'on pourrait citer :
myString + yourString pourrait servir à concaténer deux objets string
myDate++ pourrait servir à incrémenter un objet Date
a * b pourrait servir à multiplier deux objets Number
a[i] pourrait donner accès à un élément contenu dans un objet Array
x = *p pourrait déréférencer un"pointeur intelligent" qui "pointerait" en fait sur un enregistrement sur disque
le déréférencement irait chercher l'enregistrement sur le disque, le lirait, et le stockerait dans x.
La surcharge d'opérateur facilite la vie des utilisateurs d'une classe, mais pas celle du développeur de la classe!
Prenez l'exemple suivant :
class Array {
public:
int& operator[] (unsigned i); // Certains n'aiment pas cette syntaxe // ...
};
inline int& Array::operator[] (unsigned i) // Certains n'aiment pas cette syntaxe
{
// ...
}
Certains programmeurs n'aiment pas le mot-clé operator ni la syntaxe quelque peu bizarre que l'on doit utiliser dans le corps même de
la classe. La surcharge d'opérateur n'est pas faite pour faciliter la vie du developpeur de la classe, mais est faite pour faciliter
la vie de l'utilisateur de la classe :
int main()
{
Array a;
a[3] = 4; // Le code utilisateur doit être facile à écrire et à comprendre... // ...
}
Souvenez que dans un monde orienté réutilisation, vos classes ont des chances d'être utilisées par de nombreux programmeurs alors que
leur construction incombe à vous et à vous seul. Donc, favorisez le plus grand nombre même si ça rend votre tâche plus difficile.
La plupart des opérateurs peuvent être surchargés. Les seuls opérateurs C que l'on ne peut pas surcharger sont . et ?: (et aussi sizeof,
qui techniquement est un opérateur). C++ vient avec quelques opérateurs supplémentaires, dont la plupart peuvent être surchargés à
l'exception de ::, typeid et de .*
Voici un exemple de surcharge de l'opérateur d'indexation (qui renvoie une référence). Tout d'abord, sans surcharge :
class Array {
public:
int& elem(unsigned i)
{
if (i > 99)
error();
return data[i];
}
private:
int data[100];
};
int main()
{
Array a;
a.elem(10) = 42;
a.elem(12) += a.elem(13);
// ...
}
Le même exemple, cette fois-ci avec la surcharge :
class Array {
public:
int& operator[] (unsigned i)
{
if (i > 99)
error();
return data[i];
}
private:
int data[100];
};
int main()
{
Array a;
a[10] = 42;
a[12] += a[13];
}
Non, car aux moins l'une des deux opérandes d'un opérateur surchargé doit être d'un type utilisateur (c'est-à-dire une class dans la
majorité des cas).
Et même si C++ permettait cela (il ne le permet pas), vous auriez tout intérêt à utiliser une classe string plutôt qu'un tableau de char, car les tableaux
sont mauvais.
Le nom, la précédence, l'associativité et l'arité (le nombre d'opérandes) d'un opérateur sont fixés par le langage. Et C++ n'ayant pas
d'operator**, une classe ne peut à fortiori pas en avoir.
Si vous en doutez, sachez que x ** y est en fait équivalent à x * (*y) (le compilateur considère que y est un pointeur). En outre,
la surcharge d'opérateur est juste un sucre syntaxique qui est là pour remplacer avantageusement les appels de fonction. Et ce sucre
syntaxique, même s'il est bien utile, n'apporte rien de fondamental. Dans le cas qui nous intéresse ici, je vous suggère de surchager
la fonction pow(base,exponent) (<math.h> contient une version double précision de cette fonction).
Notez en passant que l'operator^ pourrait faire l'affaire pour "x à la puissance y", à ceci près qu'il n'a ni la bonne précédence ni la
bonne associativité.
La méthode la plus propre dans le cas d'indexes multiples consiste à utiliser l'operator() plutôt que l'operator[]. La raison en est
que l'operator[] prend toujours un et un seul paramètre, alors que l'operator() peut lui prendre autant de paramèters qu'il est
nécessaire (dans le cas d'une matrice rectangulaire, vous avez besoin de deux paramètres).
De quoi cette question traite-t-elle exactement? Certains programmeurs créent des classes Matrix et leur donnent un operator[] qui
renvoie une référence à un objet Array, objet Array qui lui-même possède un operator[] qui renvoie un élément de la matrice (par exemple,
une référence sur un double). Ça leur permet d'accéder aux éléments de la matrice en utilisant la syntaxe m[i][j] plutôt qu'une syntaxe
de type m(i,j) .
Cette solution de tableau de tableaux fonctionne, mais elle est moins flexible que la solution basée sur l'operator() . En effet,
l'approche utilisant l'operator() offre certaines possiblités d'optimisation qui sont plus difficilement implémentables avec l'approche
operator[][]. Cette dernière approche est donc plus susceptible de causer, au moins dans un certain nombre de cas, des problèmes de
performances.
Pour vous donner un exemple, la façon la plus simple d'implémenter l'approche operator[][] consiste à représenter physiquement la matrice
comme une matrice dense stockant ses élements en ligne (ou bien est-ce plutôt un stockage en colonne, je ne m'en souviens jamais).
L'approche utilisant l'operator() cache elle complètement la représentation physique de la matrice, ce qui peut dans certains cas donner
de meilleures performances.
En résumé: l'approche basée sur l'operator() n'est jamais moins bonne et s'avère parfois meilleure que l'approche operator[][].
L'approche operator() n'est jamais moins bonne car il est facile de l'implémenter en utilisant la représentation physique
"matrice dense - stockage en ligne". Et donc dans les cas où cette représentation physique est la plus adaptée d'un point de
vue performance, l'approche operator() est aussi facile à implémenter que l'approche operator[][] (il se pourrait même que
l'approche operator() soit légèrement plus facile à implémenter, mais je ne vais pas pinailler).
L'approche operator() s'avère parfois meilleure car à partir du moment où la représentation physique optimale n'est pas la
représentation "matrice dense - stockage en ligne", il est le plus souvent sensiblement plus facile d'implémenter l'approche operator()
que l'approche operator[][].
J'ai travaillé récemment sur un projet qui a illustré l'importance de la différence que peut faire le choix de la représentation physique.
L'accès aux éléments de la matrice y était fait colonne par colonne (l'algorithme accédait aux éléments d'une colonne, puis de la
suivante, etc.), et dans ce cas, une représentation physique en ligne risquait de diminuer l'efficacité de la mémoire cache. En effet,
si les lignes sont presque aussi grosses que la taille du cache du processeur, chaque accès à l'élément suivant dans la colonne va
demander à ce que la ligne suivante soit chargée dans le cache, ce qui fait perdre l'avantage que procure un cache. Sur ce projet, nous
avons gagné 20% en performances en découplant la représentation logique de la matrice (ligne, colonne) de sa représentation physique
(colonne, ligne).
Des exemples de ce type, on en trouve en quantité en calcul numérique et quand on s'attaque au vaste sujet que représentent les matrices
creuses. Au final, puisqu'il est en général plus facile d'implémenter une matrice creuse ou d'inverser l'ordre des lignes et des colonnes
en utilisant l'operator(), vous n'avez rien à perdre et possiblement quelque chose à gagner à utiliser cette approche.
Une bonne interface fournit une vue simplifiée exprimée dans le vocabulaire de l'utilisateur. Dans le cas de la programmation par objets,
une interface est généralement représentée par une classe unique ou par un groupe de classes très proches.
Réfléchissez d'abord à ce qu'un objet de la classe est du point de vue logique, plutôt que de réfléchir à la façon dont vous allez le
représenter physiquement. Imaginez par exemple que vous ayiez une classe Stack (une pile) et que vous vouliez que son implémentation
utilise une LinkedList (une liste chaînée)
class Stack {
public:
// ...private:
LinkedList list_;
};
La classe Stack doit-elle avoir une méthode get() qui retourne la LinkedList? Ou une méthode set() qui prenne une LinkedList? Ou encore
une constructeur qui prenne une LinkedList? La réponse est évidemment non, puisque la conception d'une classe doit s'effectuer de
l'extérieur vers l'intérieur. Les utilisateurs des objets Stack n'ont rien à faire des LinkedLists; ce qui les intéresse, c'est de
pouvoir faire des push (empiler) et des pop (dépiler).
Voyons maintenant un cas un peu plus subtil. Supposez que l'implémentation de a classe LinkedList soit basée sur une liste chaînée
d'objets Node (noeuds), et que chaque Node ait un pointeur sur le Node suivant :
class Node
{
/*...*/
};
class LinkedList {
public:
// ...private:
Node* first_;
};
La classe LinkedList doit-elle avoir une méthode get() qui donne accès au premier Node ? L'objet Node doit-il avoir une méthode get()
qui permette aux utilisateurs de passer au Node suivant dans la chaîne? La question est en fait: à quoi une LinkedList doit-elle
ressembler vu de l'extérieur? Une LinkedList est-elle vraiment une chaîne d'objets Node ? Ou cela n'est-il finalement qu'un détail
d'implementation? Et si c'est juste un détail d'implémentation, comment la LinkedList va-t-elle donner à ses utilisateurs la possibilité
d'accéder à chacun de ses éléments ?
Une réponse parmi d'autres : une LinkedList n'est pas une chaîne d'objets Nodes. C'est peut-être bien comme ça qu'elle est implémentée,
mais ce n'est pas ce qu'elle est. Ce qu'elle est, c'est une suite d'éléments. L'abstraction LinkedList doit donc être fournie avec une
classe "LinkedListIterator", et c'est cette classe "LinkedListIterator" qui doit disposer d'un operator++ permettant de passer à
l'élément suivant, ainsi que de méthodes get()/set() donnant accès à la valeur stockée dans un Node (la valeur stockée dans un Node est
sous l'unique responsabilité de l'utilisateur de la LinkedList, c'est pourquoi il faut des méthodes get()/set() permettant à cet
utilisateur de la manipuler comme il l'entend).
Toujours du point de vue de l'utilisateur, il pourrait être souhaitable que la classe LinkedList offre un moyen d'accéder à ses éléments
qui mimique la façon dont on accède aux éléments d'un tableau en utilisant l'arithmétique des pointeurs :
void userCode(LinkedList& a)
{
for (LinkedListIterator p = a.begin(); p != a.end(); ++p)
cout << *p << '\n';
}
Pour implémenter cette interface, la LinkedList va avoir besoin d'une méthode begin() et d'une méthode end(). Ces méthodes devront
renvoyer un objet de type "LinkedListIterator". Et cet objet "LinkedListIterator" aura lui besoin: d'une méthode pour se déplacer vers
l'avant (de façon à pouvoir écrire ++p); d'une méthode pour pouvoir accéder à la valeur de l'élément courant (de façon à pouvoir écrire
*p); et d'un opérateur de comparaison (de façon à pouvoir écrire p != a.end()).
Le code se trouve ci-dessous. L'idée centrale est que la classe LinkedList n'a pas de méthode donnant accès aux Nodes. Les Nodes sont
une technique d'implémentation, technique qui est complètement masquée. Les internes de la classe LinkedList pourraient tout à fait
être remplacés par une liste doublement chaînée, ou même par un tableau, avec pour seule différence une modification au niveau de la
performance des méthodes prepend(elem) et append(elem).
#include <assert.h> // Succédané de gestion d'exceptionstypedefintbool; // On aura bientôt plus besoin de çaclass LinkedListIterator;
class LinkedList;
class Node {
// Pas de membres public; c'est une "classe privée"
friend LinkedListIterator; // Une classe amie
friend LinkedList;
Node* next_;
int elem_;
};
class LinkedListIterator {
public:
bool operator== (LinkedListIterator i) const;
bool operator!= (LinkedListIterator i) const;
void operator++ (); // Aller à l'élément suivantint& operator* (); // Accèder à l'élément courantprivate:
LinkedListIterator(Node* p);
Node* p_;
};
class LinkedList {
public:
void append(int elem); // Ajoute elem après le dernier élémentvoid prepend(int elem); // Ajoute elem avant le premier élément // ...
LinkedListIterator begin();
LinkedListIterator end();
// ...private:
Node* first_;
};
Les méthodes suivantes sont de bonnes candidates pour être inline (à mettre sans doute dans le même .h):
Pour conclure: la liste chaînée gère deux sortes de données différentes. On trouve d'un côté les valeurs des éléments qui sont stockés
dans la liste chaînée. Ces valeurs sont sous la responsabilité de l'utilisateur de la liste et seulement de l'utilisateur. La liste
elle-même ne fera rien par exemple pour empêcher à un utilisateur de donner la valeur 5 au troisième élément, même si ça n'a pas de sens
dans le contexte de cet utilisateur. On trouve de l'autre côté les données d'implémentation de la liste (pointeurs next, etc.), dont les
valeurs sont sous la responsabilité de la liste et seulement de la liste, laquelle ne donne aux utilisateurs aucun accès (que ce soit en
lecture ou en écriture) aux divers pointeurs qui composent son implémentation.
Ainsi, les seules méthodes get()/set() présentes sont là pour permettre la modification des éléments de la liste chaînée, mais ne
permettent absolument pas la modification des données d'implémentation de la liste. Et la liste chaînée ayant complètement masqué son
implémentation, elle peut donner des garanties très fortes concernant cette implémentation (dans le cas d'une liste doublement chaînée
par exemple, la garantie pourrait être qu'il y a pour chaque pointeur avant, un pointeur arrière dans le Node suivant).
Nous avons donc vu un exemple dans lequel les valeurs de certaines des données d'une classe étaient sous la responsabilité des
utilisateurs de la classe (et la classe a besoin d'exposer des méthodes get()/set() pour ces données) mais dans lequel les données
contrôlées uniquement par la classe ne sont pas nécéssairement accessibles par des méthodes get()/set().
Note: le but de cet exemple n'était pas de vous montrer comment écrire une classe de liste chaînée. Et d'abord, vous ne devriez pas
"pondre" votre propre classe liste, vous devriez plutôt utiliser l'une des classes de type "conteneur standard" fournie avec votre
compilateur. La meilleure solution est d'utiliser l'une des classes conteneurs du standard C++ , par exemple la classe template list<T>.
Etant donné que ces opérateurs peuvent avoir deux définitions , le C++ leur donne deux signatures différentes. Les deux s'appelent
operator ++(), mais la version pré-incrémentation ne prend pas de paramètre, et l'autre prend un entier bidon. Nous traiterons ici
le cas de ++, mais l'opérateur -- se comporte de façon similaire. Tout ce qui s'applique à l'un s'applique donc à l'autre.
class Number {
public:
Number& operator++ (); // prefix ++
Number operator++ (int); // postfix ++
};
A remarquer : la différence des type de retour. La version préfixée renvoie par référence, la postfixée par valeur. Si cela semble
inattendu, ce sera tout à fait logique après avoir examiné les définitions ( vous vous souviendrez ensuite que y = x++ et y = ++x affectent
des résultats différents à y).
Number& Number::operator++ ()
{
// ...return *this;
}
Number Number::operator++ (int)
{
Number ans = *this;
++(*this); // or appeler simplement operator++()return ans;
}
L'autre possibilité pour la version postfixée est de ne rien renvoyer :
class Number {
public:
Number& operator++ ();
void operator++ (int);
};
Number& Number::operator++ ()
{
//...return *this;
}
void Number::operator++ (int)
{
++(*this); // ou appeler simplement operator++()
}
Attention, il ne faut pas que la version postfixée renvoie l'objet 'this' par référence, vous aurez été prévenus.
Voici comment utiliser ces opérateurs :
Number x = /* ... */;
++x; // appel de Number::operator++(), c-a-d x.operator++()
x++; // appel de Number::operator++(int), c-a-d calls x.operator++(0)
Supposant que les types de retour ne sont pas void, on peut les utiliser dans des expressions plus complexes
Number x = /* ... */;
Number y = ++x; // y sera le nouvelle valeur de x
Number z = x++; // z sera la nouvelle valeur de x
++i est parfois plus rapide que i++, mais en tout cas n'est jamais plus lent.
Pour les types de base comme les entiers, cela n'a aucune importance : i++ et ++i sont identiques point de vue rapidité. Pour des types
manipulant des classes, comme les itérateurs par exemple, ++i peut être plus rapide que i++ étant donné que ce dernier peut prendre une
copie de l'objet 'this.'
la différence, pour autant qu'ilo y en ait une n'aura aucune influence à moins que votre application soit très dépendante de la vitesse
du CPU. Par exemple, si votre application attend la plupart du temps que l'utilisateur clique sur la souris, ou qu'elle fasse des accès
disques, ou des accès réseau, ou des recherches dans une base de données, cela ne risque pas de poser problème que de perdre quelques
cycles CPU.
Si vous écrivez i++ comme une instruction isolée plutôt que comme une partie d'une expression plus complexe, pourquoi ne pas plutôt écrire
++i ? Vous ne perdrez jamais rien, et pafois même vous y gagneriez quelque chose. Les programmeurs habitués à faire du C ont l'habitude
d'écrire i++ plutôt que ++i. Par exemple, ils écrivent
for (i = 0; i < 10; i++) ....
Comme cette expression utilise i++ comme une instruction isolée, nous pourrions tout à fait écrire ++i à la place. Pour des raisons de
symétrie, j'ai une préférence pour ce style même si cela n'apporte rien au point de vue performance.
De toute évidence, quand i++ apparaît en tant que partie d'une expression plus complexe, la situation est différente : il est utilisé
parce que c'est la seule solution logique et correcte et non pas parce qu'il sagit d'une habitude héritée de l'époque ou l'on codait du C.
Ce document issu de http://www.developpez.com est soumis à la licence
GNU FDL traduit en français
ici.
Permission vous est donnée de distribuer, modifier des copies de cette page tant que cette note apparaît clairement.
Certaines parties de ce document sont sous copyright Marshall Cline