Social Icons

Sunday, May 12, 2013

Offshore Leaks: quels outils informatiques pour traiter les données ?
TURPITUDE. Des lettres, des emails, des fichiers PDF, des passeports scannés, des tableaux… C’est une masse de 2,5 millions de documents numériques, de tout type, de tout format, concernant les turpitudes de l’évasion fiscale et des paradis fiscaux que la presse a dévoilé dans le monde entier.
La source ? Un disque dur de 260 gigabytes de données envoyé à un journaliste australien il y a près d’un an et demi. Celui-ci s’est alors tourné vers l’ICIJ (Consortium international de journalistes d'investigation), une organisation fondée en 1997 pour faire travailler ensemble des journalistes de pays différents sur des sujets aux ramifications internationales.

Problème : cette manne d’informations, si sensible que le ministre français du Budget a demandé à la presse de les transmettre à la justice (ce que Le Monde a refusé de faire), s’est avérée d’abord très difficile à exploiter, car trop massive, disparate et pas structurée. L’ICIJ a donc décidé de s’équiper de plusieurs logiciels, certains fournis gratuitement par des éditeurs, d’autres développés en interne spécialement pour le projet. Une véritablement machinerie informatique destinée à traiter et explorer une masse inédite de documentation.

LE DÉROULÉ DES ÉTAPES ILLUSTRÉES CI-DESSUS PAR LA VIDÉO DE "SCIENCES ET AVENIR"

Étape 1- Il y a plus d’un an, des anciens employés de 2 sociétés offshore, Portcullis TrustNet, basée à Singapour, et Commonwealth Trust Limited (CTL), basée aux îles Vierges britanniques, envoient par courrier un disque dur contenant 260 Gigabytes de données sur 30 ans. C’est 160 fois plus que les câbles diplomatiques sortis par WikiLeaks en 2010.
Ce disque dur contient 500 000 documents textes, 2 millions d’e-mails remontant à fin des années 90, des fichiers pdf, des scans de papiers d’identité, des tableurs. Le tout concerne 10 paradis fiscaux, 122 000 sociétés offshore, 130 000 noms de personnes de 170 pays.

Étape 2- Gerard Ryle, un journaliste australien qui vient de travailler 3 ans sur le scandale Firepower International, une affaire d’escroquerie, reçoit ce disque dur. Il décide de travailler dessus dans le cadre de l’ICIJ (Consortium international de journalistes d'investigation), une organisation fondée en 1997 pour faire travailler ensemble des journalistes de pays différents sur des sujets internationaux. Gérard Ryle est aujourd’hui directeur de l’ICIJ.

Étape 3- En Nouvelle-Zélande, une équipe fait un premier travail à la main sur les données : elle identifie les noms de personnes et de sociétés cités et les associent au pays correspondant.
Les informations sont ensuite vérifiées sur le terrain, dans chaque pays.
C’est un véritable travail de fourmi, qui a pris des centaines d’heures, sans utilisation d’aucun logiciel à part pour quelques documents chiffrés.

Étape 4- L’équipe de l’ICIJ doit ensuite rescanner des documents qui s’avèrent illisibles ou inanalysables en l’état (notamment les fichiers images). Ils utilisent un logiciel de reconnaissance optique de caractères.

Étape 5- Pour pouvoir désormais analyser et traiter les données, l’ICIJ décide de s’équiper d’outils logiciels puissants :
Ils obtiennent gratuitement des licences pour utiliser 2 programmes de Free Text Retrieval (FTR) : eDiscovery, de l’éditeur australien NUIX, et dtSearch Desktop de l’éditeur américain dtSearch. NUIX fournira même aux journalistes du projet une formation à l’utilisation de son logiciel.
Ces outils vont servir à analyser tous les documents, de tous types, de tout format ; ils sont capables d’isoler des noms et des adresses, de les indexer, afin de créer une base de données structurée et de permettre ensuite de faire des recherches. Cette base de données prend le nom de OMET (offshore main entity tables).
L’ICIJ se fait développer spécialement pour ce projet 2 autres logiciels, par des développeurs britanniques, allemands et costaricains. L’un sert à retrouver et à associer les noms et les adresses qui vont ensemble. L’autre est capable d’attribuer un pays à chaque fichier, y compris quand les données géographiques manquent ou s’avèrent incomplètes.
Enfin, au fil de ses découvertes, l’organisation contacte de plus en plus de journalistes. Elle décide alors de se doter d’interface de consultation en ligne pour faciliter le travail de tout le monde. Appelée Interdata, elle est développée en 2 semaines, fin décembre 2012, par un développeur anglais. Elle permet de chercher et de télécharger des documents, sur la base de mots-clefs.

En parallèle à ces développements, et après avoir répertorié les pays concernés, l’ICIJ propose à des journalistes du monde entier de participer au projet. Au final, 86 journalistes de 46 pays sont impliqués : Le Monde, pour la France, la BBC et The Guardian pour le Royaume-Uni, la CBC pour la Canada, la Nacion pour l’Argentine, le Washington Post pour les Etats-Unis, Le Matin Dimanche pour la Suisse, l’Asahi Shimbun pour le Japon, etc.
Ils consultent la base de données via Interdata et échangent entre eux sur un forum dédié.
Sources : Le Monde, site de l’ICIJ, ITnews.com

No comments:

Post a Comment

Learn Python For Beginners

Category Of Mobile Courses

Actualités (644) Adsense (1) Affiliation (1) Algebraic Topology (2) Algorithmic (1) all-news (30) Android (5) Android App (8) Android app without code (4) Android Apps (256) Android Development (4) Android download (2) Android OS (3) AngularJS (1) Automata theory and formal language (5) Bootstrap CSS (1) C programming (5) Category and Functor (8) CMS (3) Computer Glossary (18) Create Mobile App With Ionic Framework (2) CSS (2) CSS-Cascading-Style-Sheets (4) Developpement Java (13) Differential Geometry (1) Django-Python-Framework (15) dropshiping (26) Earn Money by Internet (4) Emplois (23) Framework php (2) Fraud (2) Github (2) HTML (7) IT News (3) Java For Beginners (10) Javascript (12) Kotlin Programming Language (8) Kotlin For Mobile Android (1) Linux Download (2) Marketing (5) Mobile (3) Mobile Courses (4) Mobile Marketing (4) MoneyGram (1) News (721) Node.js (5) Open Source (1) Photoshop (1) Protect Computer (1) Python (36) Python BeautifulSoup (1) Python For Data Science (2) Python PyQt (13) Python Reference (1) Python Source Code (3) Python-Books (6) Python-DVD-Training (1) Python-Exercises (297) Python-Framework (1) Python-IDE (1) Python-Kivy-Framework (2) Python-Modules (1) Python-pdf (2) Python-pyQt (1) python-temp (3) Référencement (2) Script PHP (2) Security (6) SEO (1) Snipping Tool: Faq (1) Social Networks (1) Source Code (4) Statistics With SPSS (2) Surveillance Software (1) Travail à domicile (6) Tutoriels php en vidéos (2) Tutoriels-MySql (6) tutoriels-php (19) Utilitaires (1) VPS (1) Web Hosting (1) Webcam (1) Webmarketing (11) Western Union (1) Windows 10 (1) Windows 7 (4) Windows 7 Faq (2) Windows 8 (1) Windows Accessories (1) Windows Download (8) Windows Drivers (1) Windows Fonts (1) Windows Power Shell (2) Windows Registry (2) Windows Security (18) Windows Software (2) Windows Spyware (2) Windows utilities (3) Windows Virus (2) Windows Vista (3) Windows Wireless (1) Windows xp (1) Wordpress (1)
 

Sample text

Sample Text

 
Blogger Templates