Incident collecte SFR : danger centralisation

C’est sans doute passé inaperçu pour la plupart d’entre vous. Aux alentours de 19h15, samedi 17/09, des milliers de gens se sont retrouvés déconnectés d’Internet de manière brutale. J’en faisais partie, j’ai d’abord cru à un énième caprice de mon modem. Après une rapide vérification, j’étais bel et bien déconnecté et le modem n’y était pour rien. Le calvaire ne faisait que commencer et allait durer tout le weekend.

Sur le coup, je me suis dit « Tiens, voilà autre chose … allons voir si je suis le seul impacté ». Je me suis donc connecté via mon téléphone en 3G, sur le salon IRC d’FDN,  mon fournisseur d’accès à Internet. Force était de constater que les dégâts étaient importants. En l’espace de 10 minutes, le salon s’était vidé d’une bonne partie de ses occupants.
Tous venaient de tomber dans le trou noir informationnel qui allait durer plusieurs heures ce weekend là.

Quelques minutes passent et le verdict tombe :
17-09-2011 19:44:45< domi> Collecte SFR pétée.

Pour bien comprendre la situation, il faut expliquer ce qu’est une collecte et pourquoi mon FAI, FDN était touché. La collecte, de manière simple, désigne le trafic entre l’abonné et les équipements de son fournisseur d’accès. C’est la partie terminale du réseau qui vous relie à Internet, les capillaires. FDN, pour me fournir mon accès à Internet, possède un contrat dit « de collecte » avec un opérateur commercial qui s’appelle Nerim. Lui-même a deux contrats de collecte avec SFR et France Telecom. On comprend mieux l’enchaînement fatal.

Revenons à ce samedi. On se met à rassembler les bribes d’informations qui circulent, on informe les gens qui viennent sur le salon s’enquérir de la situation. Les heures passent. Les informations distillées par SFR sont minces. Autant dire qu’on ne sait rien et qu’on a l’impression que rien ne bouge. La lumière viendra d’OVH, autre client opérateur de SFR, lui aussi victime de l’incident. Un ticket est ouvert chez l’hébergeur grand public et depuis peu fournisseur d’accès à Internet : http://travaux.ovh.com/?do=details&id=5793 On se met alors tous à suivre ce ticket pour avoir de l’information. Et bien entendu, les heures passant, la grogne s’installe. Une impression d’inaction se dégage d’SFR, comme si l’incident n’était pas prioritaire. On saura peu après qu’il a en fait touché une moitié de ses clients pros , ainsi que presque tous ses clients opérateurs (OVH, Nerim, etc). On se dit alors « C’est bon, ce sera vite réglé si ça touche aussi des clients pros ! » C’était sans compter que nous étions le weekend.

Les heures passent, comme je le disais. Le dimanche pointe le bout de son nez et les premières connexions commencent à remonter pour retomber quelques minutes plus tard. Rien de plus rageant de retrouver le Net après des heures de coupure pour le voir disparaitre à nouveau au bout de quelques minutes. Au bout de 24h, on apprend qu’SFR a enfin daigné organiser une conférence téléphonique avec le fabricant du matériel identifié comme étant en cause, Ericsson. Pour bosser dans l’infogérance et la haute disponibilité, je peux vous dire que 24h pour en arriver là, c’est énorme. C’est impensable. En lisant ça, j’enrage devant mon écran. Quelle incompétence !

Les connexions finiront par remonter dimanche, de manière instable, via du bricolage d’après les informations du ticket d’OVH. Finalement, la cause racine de l’incident sera déterminée par Ericsson : un bug software déclenché par un paquet mal formé.

En d’autres termes, on peut faire tomber le réseau d’un Fournisseur d’Accès à Internet d’échelle nationale via quelques paquets concoctés avec soin … ça laisse songeur.

Ce qui laisse également songeur, c’est la vulnérabilité des fournisseurs d’accès qu’ils soient commerciaux (Nerim) ou associatifs (Ilico, FDN, …) qui reposent sur la collecte d’opérateurs nationaux. Une des caractéristiques connues du réseau Internet est sa résilience. Il est vulnérable localement mais pas dans son intégralité. Or, on se rend compte ici de l’ampleur que peut avoir la défaillance d’un seul opérateur.

La vulnérabilité du réseau est en fait proportionnelle à sa centralisation. Plus le réseau est centralisé, plus l’atteinte sera grande. Dans le cas présent, l’atteinte reste localisée mais sur une portion du réseau qui tend à devenir non négligeable. Et c’est bel et bien la centralisation et la concentration des acteurs qui entraîne cette faiblesse.

Ce qui fait la force du réseau, c’est sa diversité.
C’est dans cette démarche que s’inscrivent les FAI qui composent la Fédération FDN, fédération d’associations garantissant la neutralité du Net à leurs abonnés. Chaque association tire partie des infrastructures pouvant être utilisées, avec des techniques différentes (Adsl, Wifi, Fibre, etc).
Assurer la survie du réseau et sa résilience, c’est inverser la tendance de centralisation qui s’observe depuis plusieurs années. C’est aussi expliquer les enjeux de liberté d’expression, d’émancipation citoyenne et d’éducation.

Merci à SFR de m’avoir donné l’occasion d’illustrer ce pourquoi nous œuvrons au quotidien avec mes camarades de la fédération FDN.

This entry was posted in Uncategorized and tagged , , , , , . Bookmark the permalink.

7 Responses to Incident collecte SFR : danger centralisation

  1. Rémi Bouhl says:

    J’aime ce que t’as écrit, t’as totalement raison.

  2. Zekah says:

    Il faut aussi noter, que pour « masquer » leur incompétence notoire, SFR à demandé par la suite a OVH de censurer le ticket d’incident, comme si il ne s’était rien passé.

    https://twitter.com/#!/olesovhcom/status/116075471145402368

  3. Jérémie Courrèges-Anglas (cthuluh) says:

    La collecte FDN, c’est super pour un FAI associatif, ça permet d’être opérationnel
    rapidement et c’est financièrement accessible. Mais il y a sans doute moyen,
    quand on est en région, de trouver mieux (comprendre « plus local »). En tout cas nous
    chez Faimaison on a envie d’y croire,
    et on encourage tous ceux
    qui souhaitent diversifier et
    décentraliser le net français à en faire de même ! :)

  4. Nico says:

    Sans remettre tout le reste en cause, il me semble que la collecte ByTel n’est pas tombée (tout du moins grand public, leur collecte pro est tombée avec le reste).

    • taziden says:

      Effectivement, cette partie là fonctionnait toujours. Sans doute que la collecte ByTel est gérée sur des BAS différents.
      J’ai volontairement occulté pas mal de détails de l’histoire pour me centrer sur le ressenti et les conséquences.

  5. bohwaz says:

    Pour avoir aussi subi l’incident chez OVH j’ai un peu halluciné sur la réaction (ou plutôt l’inaction) de SFR. Ma connexion était down du samedi à 17h au lundi à 8h… Impensable ! Surtout que le problème ne concernait « que » l’authentification, la connexion fonctionnait, on avait juste pas le droit de l’utiliser, à cause d’un bug et de leur inaction.

  6. Cali says:

    Le meilleur moment c’est quand SFR refuse de relancer le matos car quelques clients sont encore authentifiés. :-)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>