Pourquoi Seaborn attire de plus en plus de Data Analysts ? – .

Pourquoi Seaborn attire de plus en plus de Data Analysts ? – .
Pourquoi Seaborn attire de plus en plus de Data Analysts ? – .
--

Si vous êtes un scientifique des données, il est probable que vous utilisiez Numpy pour afficher et traiter vos tableaux de données. Par nature, les bases de données intègrent beaucoup d’informations et donc, une bibliothèque telle que Numpy pour Python est extrêmement utile pour mettre en évidence des tendances, des statistiques, des situations dignes de notre attention.

Cela dit, il va sans dire qu’un bon graphique parlera toujours plus fort qu’un tableau récapitulatif. Une courbe, un histogramme, pourra faire ressortir au premier coup d’œil un phénomène sur lequel on essaie d’attirer l’attention. La donne est claire : en termes de représentation graphique en Python, vous savez aussi qu’il est possible d’utiliser la librairie Matplotlib pour tracer les graphes de votre choix, sans limite de potentiel.

Cependant, depuis 2020 environ, une autre solution est régulièrement évoquée : Seaborn, une bibliothèque Python de visualisation de données. Certes, Seaborn est beaucoup moins connu que Matplotlib et de plus, il existe très peu d’informations sur son utilisation réelle, par exemple, on ne sait pas s’il a été adopté par de grandes entreprises. Son propre créateur semble peu soucieux de promouvoir ces aspects liés à une potentielle popularité de Seaborn. En réalité, ce n’est que récemment que nous avons vu une augmentation importante de la cote de Seaborn.

Pour faire simple : une fois que vous avez essayé Seaborn, il semble souvent difficile de revenir à Matplotlib !

Seaborn contre Matplotlib

Question : pourquoi aurions-nous avantage à utiliser Seaborn plutôt que Matplotlib ? Comme nous le verrons, la réponse est multiple.

Matplotlib n’est pas facile à utiliser

Il serait difficile de remettre en cause la puissance de Matplotlib. Cependant, il faut le reconnaître : son utilisation n’est pas toujours aisée. Le souci vient surtout de la versatilité de la bibliothèque Python Matplotlib qui propose un nombre quasi incalculable d’options en tous genres. Parfois, il est difficile d’obtenir le résultat souhaité. On suit un tuto et surprise : à l’arrivée, les graphismes obtenus ne sont pas conformes à ce que l’on aurait dû obtenir. La raison est souvent liée à une très légère erreur dans la syntaxe de Matplotlib.

Matplotlib : deux approches

Si Matplotlib peut sembler intimidant voire déconcertant, c’est aussi parce qu’il repose sur deux approches possibles,

  • programmation orientée objet
  • utilisation des fonctions Matplotlib.

Chacune de ces approches reposera sur une syntaxe qui lui est propre, mais avouons-le, pour le novice qui aborde cet outil, il y a parfois de quoi perdre son latin puisqu’on a affaire à deux types de formulations différentes pour arriver au même résultat.

Les courbes Matplotlib ne sont pas toujours pratiques et esthétiques

L’autre reproche parfois adressé à Matplotlib est que par défaut, un grand nombre de représentations manquent de grâce. Pour les rendre esthétiques mais aussi utiles, il faut creuser dans les paramètres, intervenir sur l’épaisseur des traits, utiliser une « color map » (carte des couleurs), etc. Bref, obtenir un joli résultat passe souvent par l’écriture lignes et lignes de code. Est-ce vraiment la tâche attendue d’un data scientist ? Ne serait-il pas préférable qu’il passe son temps à produire le graphique souhaité plutôt que de se débattre avec tant de paramètres ?

Seaborn est arrivé…

C’est à partir de telles réflexions qu’un homme du nom de Michael Waskom, chercheur en analyse de données, a réalisé Seaborn. Waskom s’appuyait sur la librairie Matplotlib mais aussi sur Pandas, qui, rappelons-le, est dédié à l’analyse de données en Python. Seaborn a été rendu public en 2012.

---

Si la force de Seaborn devait se résumer en une phrase, ce pourrait être celle-ci :

Seaborn est capable de réaliser en une ligne de code ce qui en prendrait dix sous Matplotlib !

Oui… Qu’il suffise de dire : si vous avez essayé Matplotlib, la facilité avec laquelle Seaborn peut produire des graphiques est stupéfiante. C’est notamment le cas de la fonction pairplot qui propose plusieurs représentations possibles d’un tableau de données. A peine la consigne correspondante est-elle formulée que ces multiples graphiques apparaissent, apportant des informations utiles sur les différentes courbes observées.

Autre point fort : toutes les fonctions – ou presque – de Seaborn ont une forme standard et donc, vous pouvez facilement réutiliser le code utilisé l’une sur l’autre. Si vous avez des semaines ou des mois de pratique de Matplotlib derrière vous, gageons qu’une telle opportunité est surprenante et donne envie d’en savoir plus.

Puisqu’il en est ainsi, comment peut-on apprendre à maîtriser Seaborn ? Si vous parlez bien anglais, alors vous pouvez suivre le tutoriel proposé sur le site officiel de cette bibliothèque. Vous pourrez ensuite vous entraîner sur les exemples de code proposés.

Quelle que soit la solution adoptée, il est important de prendre le temps de bien pratiquer chaque exemple de telles formations et d’assimiler patiemment les concepts et la syntaxe. Comme souvent avec Python, le moindre détail peut conduire à une erreur et il n’est pas toujours facile de le repérer au premier coup d’œil. Ce que Seaborn peut faire pour augmenter la productivité vaut bien la courbe d’apprentissage.

Point important : une bonne maîtrise de Seaborn suppose idéalement d’avoir acquis une certaine maîtrise des librairies telles que Numpy et Pandas.

Seaborn est-il la solution à tout ?

Vous vous en doutez probablement : Seaborn n’est cependant pas une solution universelle. Il y a certaines situations dans lesquelles Matplotlib sera plus approprié. On pense notamment aux applications d’ingénierie. Et si vous cherchez un graphe spécialisé et ultra personnalisé, vous avez plus de chances de trouver votre bonheur dans Matplotlib. Bref, Seaborn est avant tout adapté à la représentation de données statistiques.

Cela étant dit, certains utilisateurs de Python préfèrent un troisième choix : Plotly Express, qui est similaire en termes de facilité d’utilisation et qui contient de nombreux exemples de tracés dans sa documentation.

 
For Latest Updates Follow us on Google News
 

---

PREV Square Enix dévoile son jeu NFT Symbiogenesis, et c’est compliqué
NEXT Les scinques se reconnaissent en tirant la langue – .