Risques
Qu’est-ce que l’outil « Risques » ?
Cet outil, généralement utilisé en milieu professionnel en ingénierie ou recherche, a été suggéré par Odalric-Ambrym Maillard, suiveur du projet.
L’outil « Risques » permet d’évaluer les risques potentiels d’une conception. Le but a d’abord été de proposer une description du risque, puis une brève analyse.
Pour cela, on tente d’abord d’évaluer la probabilité du risque : est-ce qu’il y a de fortes chances que ce risque survienne ?
Ensuite, on imagine l’impact que cela pourrait avoir si le risque prenait effectivement forme. Cet impact serait-il important, moyen, faible ? Cela permet notamment de considérer les impacts à différentes échelles.
Finalement, on imagine les moyens d’action pour prévenir et/ou limiter le risque.
Risque 1 : Tensions économiques inter-pays
Le développement du projet à l’international pourrait créer des tensions entre certains pays. En effet, si un pays collecte les données d’un autre via l’utilisation de Diser et arrive à avoir des rendements supérieurs, il multipliera alors ses exportations. Cela pourra porter préjudice à l’économie des autres pays. Un pays pourrait avoir des rendements supérieurs à un autre en raison d’un meilleur outillage, d’un meilleur accès à certaines ressources, ou simplement grâce à une situation géographique plus favorable au développement d’une culture.
Probabilité du risque : assez élevée| Dans la société capitaliste actuelle, les intérêts économiques de tous les pays ne sont pas toujours respectés. Ainsi, il est assez probable qu’un gouvernement/pays profite du dispositif Diser pour créer du profit au dépens d’un autre.
Impact : Moyen | Ce risque pourrait entraîner l’effet inverse du but du projet : en utilisant Diser, l’objectif est de promouvoir les pratiques agroécologiques. En revanche, si un pays collecte les données d’un autre et arrive à avoir des rendements supérieurs, le pays dont les données ont été collectées pourrait revenir à des pratiques non agroécologiques, afin de maintenir la concurrence.
Limiter le risque : Il serait possible, par exemple, de mettre en place une licence qui impose à celui qui utilise les données d’adopter la même licence et donc de partager aussi ses données. Même si cette démarche pourrait limiter le risque, nous sommes conscients qu’il ne pourrait pas être éliminé à 100%.
Risque 2 : Pollution engendrée par le stockage des données Diser
La généralisation du projet peut créer une source de pollution à cause du stockage d’un très grand nombre de données. En effet, les datacenters sont généralement polluants et consommateurs de ressources. Ainsi, si le projet est généralisé, un grand nombre de données seront stockées, ce qui pourrait générer de la pollution. Ceci serait d’autant plus vrai si ces données sont utilisées pour la recherche, car elles devront être stockées plus longtemps.
Probabilité du risque : Moyenne | Il faudrait que Diser soit adopté par un grand nombre d’agriculteurs pour que le stockage des données engendre une surconsommation des ressources et une pollution accrue.
Impact : Faible | À l’échelle planétaire, la pollution engendrée par le stockage des données Diser ne représenterait qu’un très faible pourcentage.
Limiter le risque : Il est possible d’agir sur la taille des serveurs, mais aussi sur leur décentralisation. Le but est de stocker les données sur des serveurs, et d’éviter le recours aux datacenters.
En utilisant des serveurs locaux, moins de ressources sont utilisées pour les fabriquer (car ce sont des serveurs plus petits) et lors de leur utilisation (car ils nécessitent moins d’énergie pour leur fonctionnement et leur refroidissement).
Egalement, le fait de décentraliser ces serveurs permet de les adapter à l’utilisation qui y est faite dans chaque région. De plus, cela répartit l’utilisation des ressources (électricité, eau).
Estimation de l’énergie nécessaire au stockage des données d’une région comme celle des Hauts-De-France :
N.B : Ces calculs sont basés sur des estimations notamment dues aux imprécisions pour la taille des fichiers JSON.
Le stockage se ferait sur un serveur NAS. Ce dernier permet le stockage d’un nombre suffisant de données grâce à la mise en fonctionnement simultanée de différents disques durs. Ainsi, calculer la consommation du serveur NAS revient à calculer la somme des énergies nécessaires au fonctionnement de tous les disques durs.
Commençons par estimer le stockage nécessaire avec l’exemple de la région des Hauts-de-France. On recense dans cette région plus de 30 000 agriculteurs, en faisant l’approximation qu’un quart d’entre eux soient des usagers de Diser, on se retrouve avec 7500 agriculteurs à considérer. Les informations extraites des carnets sont converties en fichier « .JSON », dont la taille moyenne se situe aux alentours de la dizaine, voire la centaine de Ko dans les cas plus extrêmes. Cependant, il est compliqué d’estimer combien ces fichiers pèseront à ce stade du projet, ce qui nous amène à voir une estimation à la hausse. Considérons que tous ces fichiers pèseront 300 Ko.
Ainsi pour 7500 agriculteurs et pour un fichier JSON associé aux informations d’une semaine de carnet de bord, on obtient pour une année le stockage suivant :
7500 * 300Ko * 52 semaines= 117 Go/an
Cela peut se contenir dans des disques durs type SSD, dont les capacités de stockage peuvent varier, on choisira ici un Samsung EVO 870 d’une capacité de 500Go réputé pour son efficacité énergétique.
Cela nous permet d’estimer la consommation pour le fonctionnement général du serveur NAS. On choisit pour le NAS une solution économique, un Raspberry pi 4. On prend en compte le fonctionnement global du serveur qui associe plusieurs composants simultanément. Le mode de fonctionnement est soit actif, soit au repos. La puissance au repos est de 3,5 W contre 6 W en mode actif. En partant du principe que sur une journée de travail le serveur est au repos pendant 22h et qu’il réalise des tâches pendant 2h, on réalise les calculs suivants :
Fonctionnement du mode actif (MA) sur une année :
Energie MA = Puissance MA * Temps de fonctionnement = 6W * 2h * 365 jours = 4380 Wh/an
Fonctionnement au repos (R) sur une année :
Energie R = Puissance R * Temps de fonctionnement = 3,5W * 22h * 365 jours = 28105 Wh/an
On obtient donc finalement une consommation totale à l’année de 32,5 kWh. Cette valeur est très faible, par exemple une simple ampoule 50 W que l’on pourrait retrouver dans nos foyers consomme la même énergie sur une année entière.
Ce calcul nous donne en réalité le fonctionnement pour la première année. Après plusieurs années de fonctionnement, il y aura plus de données à stocker et il sera nécessaire de rajouter des SSD pour le stockage, cela va augmenter légèrement la consommation d'énergie. Le souci de ce système de stockage par serveur NAS est qu'il ne garantit pas une protection des données 100% sans failles. Cela pourrait être problématique au regard de la confidentialité des données des agriculteurs.
Risque 3 : Les agriculteurs perdent de l’intérêt à partager leurs données
Au-delà du risque international, il existe aussi un risque entre agriculteurs : si les données collectées sur une ferme servent plus à leurs voisins qu’à l’agriculteur qui les fournit, cela peut limiter l’envie de partager des données ouvertement, car une « concurrence » pourrait s’installer.
Probabilité du risque : Moyen | Le projet Diser s’appuie sur un partage de données contrôlé grâce à l’anonymisation des données qui limite le risque. En revanche, il peut arriver qu’un agriculteur tire profit d’informations d’un autre agriculteur, sans que ce risque n’ait été anticipé.
Impact : Moyen | Du point de vue social, les agriculteurs pourraient perdre leur confiance mutuelle et des tensions pourraient apparaître si une concurrence déloyale se met en place. Du point de vue écologique, si les agriculteurs cessent de partager leurs données, l’intérêt de Diser de mettre en lumière des pratiques agroécologiques diminue.
Limiter le risque : Mise en place d’un système de consentement (voir outil RGPD) pour que chaque agriculteur décide précisément quelles données il partage, avec qui et pour quelle finalité. Il serait aussi possible d’assurer un retour de valeur clair à tous les agriculteurs partageant leurs données. Cela signifie la garantie que toute utilisation de leurs données leur apporterait un bénéfice, tel que l’accès à des résultats ou analyses.
