Problème du télécharger des données

lihp · 2 July 2021 13:01

Bonjour,

Pourriez-vous m’aider à charger les données s’il vous plaît ? En effet, lorsque je voulais charger les données “penguins”, j’ai le message d’erreur suivant :

---------------------------------------------------------------------------
EmptyDataError                            Traceback (most recent call last)
<ipython-input-2-b2c7c1ee76f8> in <module>
      1 import pandas as pd
      2 
----> 3 penguins = pd.read_csv("../datasets/penguins_regression.csv")
      4 feature_names = "Flipper Length (mm)"
      5 target_name = "Body Mass (g)"

/opt/conda/lib/python3.9/site-packages/pandas/io/parsers.py in read_csv(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, skipfooter, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, cache_dates, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, doublequote, escapechar, comment, encoding, dialect, error_bad_lines, warn_bad_lines, delim_whitespace, low_memory, memory_map, float_precision, storage_options)
    608     kwds.update(kwds_defaults)
    609 
--> 610     return _read(filepath_or_buffer, kwds)
    611 
    612 

/opt/conda/lib/python3.9/site-packages/pandas/io/parsers.py in _read(filepath_or_buffer, kwds)
    460 
    461     # Create the parser.
--> 462     parser = TextFileReader(filepath_or_buffer, **kwds)
    463 
    464     if chunksize or iterator:

/opt/conda/lib/python3.9/site-packages/pandas/io/parsers.py in __init__(self, f, engine, **kwds)
    817             self.options["has_index_names"] = kwds["has_index_names"]
    818 
--> 819         self._engine = self._make_engine(self.engine)
    820 
    821     def close(self):

/opt/conda/lib/python3.9/site-packages/pandas/io/parsers.py in _make_engine(self, engine)
   1048             )
   1049         # error: Too many arguments for "ParserBase"
-> 1050         return mapping[engine](self.f, **self.options)  # type: ignore[call-arg]
   1051 
   1052     def _failover_to_python(self):

/opt/conda/lib/python3.9/site-packages/pandas/io/parsers.py in __init__(self, src, **kwds)
   1896 
   1897         try:
-> 1898             self._reader = parsers.TextReader(self.handles.handle, **kwds)
   1899         except Exception:
   1900             self.handles.close()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader.__cinit__()

EmptyDataError: No columns to parse from file

Que faire ?
Merci beaucoup pour votre aide.
lihp

ThomasLoock · 2 July 2021 13:15

Hi,
Que voyez-vous lorsque vous exécutez cette ligne de code ?

!ls "../datasets"

Ces fichiers doivent être répertoriés:

adult-census.csv cps_85_wages.csv
adult-census-numeric-all.csv house_prices.csv
adult-census-numeric.csv penguins_classification.csv
adult-census-numeric-test.csv penguins.csv
bike_rides.csv penguins_regression.csv
blood_transfusion.csv README.md

lihp · 2 July 2021 15:33

Bonjour,

Oui, je vois ces 6 fichiers. Mais je n’ai pas réussi à les utiliser.

Merci !

glemaitre58 · 5 July 2021 08:37

Est ce que le probleme persiste? Si oui je pense que vous avez ecrase le fichier (sans connaitre la raison )

Il est possible to remplacer le fichier corrompu avec le fichier original:

import pandas as pd

penguins = pd.read_csv("https://raw.githubusercontent.com/INRIA/scikit-learn-mooc/master/datasets/penguins_regression.csv")
penguins.to_csv("../datasets/penguins_regression.csv", index=False)

Ce code charge le fichier original stocke sur GitHub et ensuite le sauvegarde sur la machine que vous utilise sur FUN.

Vous pourrez alors relancez le code qui vous donnait une erreur.

lihp · 6 July 2021 20:55

glemaitre58:

import pandas as pd

penguins = pd.read_csv("https://raw.githubusercontent.com/INRIA/scikit-learn-mooc/master/datasets/penguins_regression.csv")
penguins.to_csv("../datasets/penguins_regression.csv", index=False)

Bonjour,
Le problème demeure. Merci beaucoup de votre aide !

ogrisel · 8 July 2021 17:04

Que donne la commande:

!ls -l "../datasets"

et la commande:

!head "../datasets/penguins_regression.csv"