Archive du forum du MOOC Recherche Reproductible Session 2

Évaluation par les pairs: Sujet 1

djibidl

Bonjour ;

Je voudrais de l’aide sur comment sauter plusieurs lignes dans la lecture d’un fichier csv ?

Dans le sujet 1 du volet évaluation par les pairs, Concentration de CO2 dans l’atmosphère depuis 1958, le début du fichier csv contient beaucoup de commentaires. Je voudrais les sauter lors du chargement. J’ai essayé le code suivant :

 %matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd
import isoweek
data_url = "http://scrippsco2.ucsd.edu/assets/data/atmospheric/stations/in_situ_co2/monthly/monthly_in_situ_co2_mlo.csv"
raw_data = pd.read_csv(data_url,skiprows=[for i in range(1,54)])
raw_data

Mais à l’exécution, j’ai l’erreur suivant :

 File "<ipython-input-8-1d4716ce7727>", line 1
    raw_data = pd.read_csv(data_url,skiprows=[for i in range(1,54)])
                                                ^
SyntaxError: invalid syntax 

Merci de votre aide !

khinsen

Si vous regardez bien l’exemple qu’on fournit pour l’analyse du syndrôme grippal, vous voyez que l’argument skiprows est un entier et décrit le nombre de ligne à sauter. Pour sauter 54 lignes, c’est donc

raw_data = pd.read_csv(data_url, skiprows=54)
djibidl

Merci bien.

Je vais finir l’exercice pour moi même.
Car l’échéance est passée.

lfarhi

Bonjour @djibidl
Vous pouvez toujours proposer votre document dans ce forum pour avoir l’avis des autres participants. Il suffit juste de donner : le sujet, le parcours et le lien vers votre espace Gitlab du document.
Nous mettrons dans un entrepôt Gitlab public les meilleures copies de cet exercice.
Cordialement