1. Problema
Se requiere crear un resumen y estadísticas de un volumen de datos considerable.
2. Solución
Existe una librería muy poderosa para computar estadísitcas y resúmenes de datos: Pandas. Esta librería provee un sinnúmero de funciones para el tratamiento de datos de gran volumen (Beazly, Jones, 2013).
3. Código Python 3
Archivo Python resumenes-estadisticas-datos.py [enlace alternativo]:
Prueba de ejecución:
Unnamed: 0 litter rx time status
0 1 1 1 101 0
1 2 1 0 49 1
2 3 1 0 104 0
3 4 2 1 104 0
4 5 2 0 102 0
Unnamed: 0 litter rx time status
145 146 49 0 91 0
146 147 49 0 104 0
147 148 50 1 104 0
148 149 50 0 104 0
149 150 50 0 79 1
0 0
1 1
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0
11 0
12 0
13 0
14 0
15 1
16 1
17 0
18 1
19 0
20 1
21 1
22 0
23 0
24 0
25 0
26 0
27 1
28 0
29 0
Name: status, dtype: int64
Unnamed: 0 litter rx time status
count 150.000000 150.000000 150.000000 150.000000 150.000000
mean 75.500000 25.500000 0.333333 89.426667 0.266667
std 43.445368 14.479214 0.472984 17.277190 0.443698
min 1.000000 1.000000 0.000000 34.000000 0.000000
25% 38.250000 13.000000 0.000000 78.250000 0.000000
50% 75.500000 25.500000 0.000000 94.500000 0.000000
75% 112.750000 38.000000 1.000000 104.000000 1.000000
max 150.000000 50.000000 1.000000 104.000000 1.000000
Archivo ratas.csv [enlace alternativo].
Prueba de ejecución:
Unnamed: 0 litter rx time status
0 1 1 1 101 0
1 2 1 0 49 1
2 3 1 0 104 0
3 4 2 1 104 0
4 5 2 0 102 0
Unnamed: 0 litter rx time status
145 146 49 0 91 0
146 147 49 0 104 0
147 148 50 1 104 0
148 149 50 0 104 0
149 150 50 0 79 1
0 0
1 1
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0
11 0
12 0
13 0
14 0
15 1
16 1
17 0
18 1
19 0
20 1
21 1
22 0
23 0
24 0
25 0
26 0
27 1
28 0
29 0
Name: status, dtype: int64
Unnamed: 0 litter rx time status
count 150.000000 150.000000 150.000000 150.000000 150.000000
mean 75.500000 25.500000 0.333333 89.426667 0.266667
std 43.445368 14.479214 0.472984 17.277190 0.443698
min 1.000000 1.000000 0.000000 34.000000 0.000000
25% 38.250000 13.000000 0.000000 78.250000 0.000000
50% 75.500000 25.500000 0.000000 94.500000 0.000000
75% 112.750000 38.000000 1.000000 104.000000 1.000000
max 150.000000 50.000000 1.000000 104.000000 1.000000
Archivo ratas.csv [enlace alternativo].
4. Literatura & Enlaces
Beazly D, Jones B. K. (2013). Python Cookbook, Third Edition. United States: O'Reilly Media.
O
No hay comentarios:
Publicar un comentario
Envíe sus comentarios, dudas, sugerencias, críticas. Gracias.