Site Tools


sirene

Pour le StockEtablissement Géocodé :

SIRENE geocodée

Détails sur GitHub CQuest

Seul le fichier StockEtablissement est traité, vu que c'est le seul fichier parmis les 4 diffusés par l'INSEE qui contient des adresses.

Les changements:
- les fichiers sont désormais tous compressés en gzip (plus de 7z)
- un traitement supplémentaire prends en compte les anciennes communes qui n'existent plus (fusions) et leur fait correspondre le code INSEE actuel afin de permettre le géocodage
- le stock national est disponible pour les établissements Actifs et pour l'ensemble des établissements (Actifs ou Fermés)

# Fichiers générés

- StockEtablissement_geo.csv.gz : fichier national complet (29 millions)
- StockEtablissementActif_geo.csv.gz : fichier national des établissements Actifs (11 millions)
- geo_siret_DDD.csv.gz : stock complet pour un département (et arrondissements de Paris)
- communes/{codeINSEEcommune}.csv : stock complet pour une commune
- logs.7z : logs complet de géocodage (un fichier par département)
- stats.json : statistiques finales du géocodage par département

import sur db1 dans /home/data/SIRENE

puis createStockEtabGeo

puis loadStockEtabGeo

ou bien dans PostgreSQL loadetabpostgres

Pour le StockUniteLegale :

createStockULpostgres

puis : loadStockULGeo

pour créer index : create index on table (siren) ;

sirene.txt · Last modified: 2019/03/18 14:40 (external edit)