0% acharam este documento útil (0 voto)

45 visualizações23 páginas

AulasManuelB3.Ipynb - Colaboratory 2

O documento descreve como carregar dados numéricos de um arquivo CSV no Google Drive, calcular estatísticas descritivas sobre as colunas, separar os dados em conjuntos de treino e teste, e salvar os conjuntos no Drive. Primeiro, importa bibliotecas como drive e numpy, carrega os dados do arquivo CSV, e calcula estatísticas como média, desvio padrão, mínimo e máximo para cada coluna. Em seguida, separa 80% dos dados para treino e 20% para teste, e salva os conjuntos no Drive.

Enviado por

caped.20201p2ti0146

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

45 visualizações23 páginas

AulasManuelB3.Ipynb - Colaboratory 2

Enviado por

caped.20201p2ti0146

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 23

from google.colab import drive #importar a biblioteca drive de google.

colab
drive.mount('/content/drive') #Liga o seu gDrive a um caminho padrão
import numpy as np #Importamos o numpy e seguimos normalmente
print('Criando arquivo de números aleatórios...')
meuarray = np.random.randint(1,80, 1000).reshape((100,10)) #Cria um array de dim
print(meuarray) #Imprime o arra criado
print('Salvando o arquivo com as dimensões: ', meuarray.shape)
np.savetxt('/content/drive/MyDrive/meuarray.csv', meuarray, delimiter=",") #Salv
print('Arquivo .csv salvo com sucesso!')
print('Você poderá ver este arquivo direto no gDrive ou carregando-o em novas se

Drive already mounted at /content/drive; to attempt to forcibly remount, ca

Criando arquivo de números aleatórios...
[[20 27 77 39 19 79 67 46 40 60]
[19 68 33 36 16 71 55 4 28 13]
[31 43 14 70 60 67 47 16 71 76]
[65 24 24 63 79 50 54 57 1 41]
[35 57 13 40 18 24 39 60 55 45]
[71 28 52 6 68 45 64 61 16 21]
[38 68 63 64 67 35 70 41 69 46]
[64 46 52 61 74 34 22 37 59 29]
[ 7 60 56 23 33 27 45 42 39 60]
[46 44 64 44 78 47 41 38 35 1]
[51 47 13 65 59 35 22 72 1 8]
[77 60 1 21 65 8 23 52 8 28]
[48 56 17 72 53 70 13 5 14 41]
[21 6 48 34 8 35 67 43 70 2]
[79 32 6 56 10 20 23 33 40 47]
[74 33 44 48 70 78 42 18 5 29]
[63 53 6 37 59 54 20 36 55 75]
[35 15 61 70 42 76 18 2 72 49]
[65 15 29 39 47 59 58 66 25 18]
[74 23 51 27 48 9 66 27 19 13]
[24 68 77 58 27 67 43 38 64 3]
[40 39 1 46 32 9 72 70 48 8]
[28 70 57 40 76 38 29 56 18 45]
[36 24 29 29 47 6 49 67 73 19]
[48 20 55 36 19 67 57 65 61 73]
[20 21 19 10 9 24 17 27 40 31]
[45 6 12 51 53 29 41 36 18 36]
[37 36 39 7 78 23 19 23 39 65]
[76 67 14 28 18 57 68 74 12 46]
[58 29 3 12 79 10 18 52 73 76]
[34 72 18 6 7 56 17 65 54 27]
[59 21 17 69 32 17 4 42 77 52]
[65 25 19 4 73 72 15 67 55 15]
[24 31 10 65 14 26 36 9 44 1]
[69 74 55 79 13 13 36 49 50 6]

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 1 de 23
:
[28 76 63 14 42 49 9 3 47 64]
[ 7 64 53 62 6 54 31 28 61 46]
[31 32 60 14 71 39 61 40 45 16]
[46 64 41 42 74 27 54 15 76 33]
[30 45 23 27 2 44 24 1 18 8]
[16 4 11 65 26 50 2 65 8 4]
[43 50 57 60 44 30 28 50 73 53]
[74 67 56 32 8 36 9 28 23 55]
[48 9 26 11 65 73 23 58 6 30]
[20 11 36 38 31 23 65 56 30 41]
[31 13 67 58 23 40 72 1 63 43]
[17 54 15 25 10 64 24 30 36 64]
[22 3 47 12 73 58 1 16 66 48]
[18 12 23 7 24 21 78 17 30 58]
[79 24 78 76 64 21 47 40 48 37]
[ 6 13 64 72 79 32 29 51 27 41]
[47 24 41 13 59 53 14 71 15 59]
[79 25 24 75 36 12 50 36 73 56]
[11 64 26 2 42 1 24 56 74 43]
[18 71 74 46 69 26 53 62 33 31]
[50 3 47 39 63 52 68 69 71 29]
[64 31 5 13 19 17 6 23 61 48]

from google.colab import drive #Necessario para acessar o gDrive

drive.mount('/content/drive') #Necessário para acessar o gDrive
import numpy as np #Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais Iris')
print('Abaixo estamos carregando os dados na variável r das colunas específicas'
r = np.loadtxt('/content/drive/MyDrive/iris/iris.data', delimiter = "," ,usecols
print(r.shape) #Daqui em diante pode-se fazer qualquer operação como slices e ca
print('Calculando dados: ')
n_cols = r.shape[1]
for col in range(n_cols):
print('desvio padrão coluna %s foi %s: ' % (col, r[ : , col]. std()))
print('Media coluna %s foi %s: ' % (col, r[ : , col]. mean()))
print('valor minino da coluna %s foi %s: ' % (col, r[ : , col].
max()))
print('valor minino da coluna %s foi %s: ' % (col, r[ : , col]. min()))
print()
print('fim do loop estartístico...')
print('separando 120 registros -= 80% do dataset...')
r80 = r[0:119 , : ]
r20 = r[0:120 , : ]
print('Dimençoes do 80%: ', r80.shape)
print('Dimençoes do 20%: ', r20.shape)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 2 de 23
:
Drive already mounted at /content/drive; to attempt to forcibly remount, ca
Carregando arquivo numérico de dados reais Iris
Abaixo estamos carregando os dados na variável r das colunas específicas
(150, 4)
Calculando dados:
desvio padrão coluna 0 foi 0.8253012917851409:
Media coluna 0 foi 5.843333333333334:
valor minino da coluna 0 foi 7.9:
valor minino da coluna 0 foi 4.3:

fim do loop estartístico...

desvio padrão coluna 1 foi 0.4321465800705435:
Media coluna 1 foi 3.0540000000000003:
valor minino da coluna 1 foi 4.4:
valor minino da coluna 1 foi 2.0:

fim do loop estartístico...

desvio padrão coluna 2 foi 1.7585291834055212:
Media coluna 2 foi 3.758666666666666:
valor minino da coluna 2 foi 6.9:
valor minino da coluna 2 foi 1.0:

fim do loop estartístico...

desvio padrão coluna 3 foi 0.7606126185881716:
Media coluna 3 foi 1.1986666666666668:
valor minino da coluna 3 foi 2.5:
valor minino da coluna 3 foi 0.1:

fim do loop estartístico...

separando 120 registros -= 80% do dataset...
Dimençoes do 80%: (119, 4)
Dimençoes do 20%: (120, 4)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 3 de 23
:
from google.colab import drive #Necessario para acessar o gDrive
drive.mount("/content/drive")#Necessário para acessar o gDrive
import numpy as np#Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais')
print("Abaixo estamos carregando os dados na variável r das colunas específicas"
r = np.loadtxt("/content/drive/MyDrive/dados/dataR2.csv", delimiter = ","
print(r.shape) #Daqui em diante pode-se

print("Calculando dados: ")

n_cols = r.shape[-1]
for col in range(n_cols-1):
print("Desvio padrão coluna %s foi %s: " % (col , r[ : , col ].std()))
print("Media coluna %s foi %s: " % (col , r[ : , col ].mean()))
print("Valor máximo da coluna %s foi %s: " % (col , r[ : , col ].max()))
print("Valor mínimo da coluna %s foi %s: " % (col , r[ : , col ].min()))
print()
print("Fim do loop eststístico...")
print("Separando 120 registros ~= 80% do dataset...")
r80 = r[0:93 , : ]
r20 = r[94: , : ]
print("Dimensoes do 80%: ", r80.shape)
print("Dimensoes do 20%: ", r20.shape)
print("Salvando arquivos no Drive...")
np.savetxt("/content/drive/MyDrive/dados/dataR2.csv", r80, delimiter = ","
np.savetxt("/content/drive/MyDrive/dados/dataR2.csv", r20, delimiter = ","
print("Arquivos salvos, verifique o seu gdrive....")

from google.colab import drive #Necessario para acessar o gDrive

drive.mount("/content/drive")#Necessário para acessar o gDrive
import numpy as np#Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais')
print("Abaixo estamos carregando os dados na variável r das colunas específicas"
r = np.loadtxt("/content/drive/MyDrive/dados/dataR2.csv", delimiter = ","
print(r.shape) #Daqui em diante pode-se

print("Calculando dados: ")

n_cols = r.shape[1]
for col in range(n_cols -1):
print("Desvio padrão coluna %s foi %s: " % (col , r[ : , col ].std()))
print("Media coluna %s foi %s: " % (col , r[ : , col ].mean()))
print("Valor máximo da coluna %s foi %s: " % (col , r[ : , col ].max()))
print("Valor mínimo da coluna %s foi %s: " % (col , r[ : , col ].min()))
print()
print("Fim do loop eststístico...")

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 4 de 23
:
print("Separando 120 registros ~= 80% do dataset...")
r80 = r[0:93 , : ]
r20 = r[94: , : ]
print("Dimensoes do 80%: ", r80.shape)
print("Dimensoes do 20%: ", r20.shape)
print("Salvando arquivos no Drive...")
np.savetxt("/content/drive/MyDrive/dados/bcancer-80.csv", r80, delimiter =
np.savetxt("/content/drive/MyDrive/dados/bcancer-20.csv", r20, delimiter =
print("Arquivos salvos, verifique o seu gdrive....")

Drive already mounted at /content/drive; to attempt to forcibly remount, ca

Carregando arquivo numérico de dados reais Iris
Abaixo estamos carregando os dados na variável r das colunas específicas
(116, 10)
Calculando dados:
Desvio padrão coluna 0 foi 16.043163667918627:
Media coluna 0 foi 57.30172413793103:
Valor máximo da coluna 0 foi 89.0:
Valor mínimo da coluna 0 foi 24.0:

Desvio padrão coluna 1 foi 4.998450415489925:

Media coluna 1 foi 27.582110827413796:
Valor máximo da coluna 1 foi 38.57875854:
Valor mínimo da coluna 1 foi 18.37:

Desvio padrão coluna 2 foi 22.427860307100534:

Media coluna 2 foi 97.79310344827586:
Valor máximo da coluna 2 foi 201.0:
Valor mínimo da coluna 2 foi 60.0:

Desvio padrão coluna 3 foi 10.024278156632223:

Media coluna 3 foi 10.012086206896551:
Valor máximo da coluna 3 foi 58.46:
Valor mínimo da coluna 3 foi 2.432:

Desvio padrão coluna 4 foi 3.626310750341434:

Media coluna 4 foi 2.694987564396551:
Valor máximo da coluna 4 foi 25.05034187:
Valor mínimo da coluna 4 foi 0.467408667:

Desvio padrão coluna 5 foi 19.100428483698998:

Media coluna 5 foi 26.61508017241379:
Valor máximo da coluna 5 foi 90.28:
Valor mínimo da coluna 5 foi 4.311:

Desvio padrão coluna 6 foi 6.813780440401913:

Media coluna 6 foi 10.180873965517241:
Valor máximo da coluna 6 foi 38.04:
Valor mínimo da coluna 6 foi 1.65602:

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 5 de 23
:
Desvio padrão coluna 7 foi 12.337122119975472:
Media coluna 7 foi 14.725965862068962:
Valor máximo da coluna 7 foi 82.1:
Valor mínimo da coluna 7 foi 3.21:

Desvio padrão coluna 8 foi 344.41843310309287:

Media coluna 8 foi 534.647:
Valor máximo da coluna 8 foi 1698.44:
Valor mínimo da coluna 8 foi 45.843:

Fim do loop eststístico...

Separando 120 registros ~= 80% do dataset...
Dimensoes do 80%: (93, 10)
Dimensoes do 20%: (22, 10)
Salvando arquivos no Drive...
Arquivos salvos, verifique o seu gdrive....

import matplotlib.pyplot as plt

year = [1950, 1970, 1990, 2010]
pop = [2.519, 3.692, 5.263, 6.972]
plt.scatter(year, pop)
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 6 de 23
:
import matplotlib.pyplot as plt
x = [1,2,3,4]
Y = [2,3,4,3]
plt.bar(x,Y)
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 7 de 23
:
values = [0,0.6,1.4,1.6,2.2,2.5,2.6,3.2,3.5,3.9,4.2,6]
plt.hist(values, bins = 3) #bins indica quantas barras
plt.show() #exibe o plot

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 8 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 9 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
#Nas próximas duas linhas customizamos
plt.xlabel('Ano')
plt.ylabel('População')
plt.show() #Exibe o gráfico

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 10 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
#A partir daqui temos as customizações no .plt
plt.xlabel('Ano')
plt.ylabel('População')
plt.title('Projeções para população mundial')
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 11 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
#A partir daqui temos as customizações no .plt
plt.xlabel('Ano')
plt.ylabel('População')
plt.title('Projeções para população mundial')
plt.yticks([0, 2, 4, 6, 8, 10])
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 12 de 23
:
import numpy as np
from matplotlib import pyplot as plt

a = np.random.randint(0,5999,30008).reshape((3751,8))
print(a.shape)
x = a[ : , 2]
y = a[: , 4]

f = [1.68, 1.70, 1.60, 1.50, 1.82, 1.69,]

plt.plot(x,y)
plt.title("Grafico de linhas")
plt.xlabel("terceira coluna")
plt.ylabel("quinta coluna")
plt.show()
print()

(3751, 8)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 13 de 23
:
import numpy as np
from matplotlib import pyplot as plt
f = [1.68,1.70, 1.55, 1.56, 1.60, 1.58, 1.82, 2.6]
plt.boxplot(f , meanline=True)
plt.show()
print()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 14 de 23
:
import numpy as np
from matplotlib import pyplot as plt
f = [1.68,1.70, 1.55, 1.56, 1.60, 1.58, 1.82, 2.6, 1,68, 1.68, 1.68, 1.94,
plt.hist(f, bins=4)
plt.show()
print()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 15 de 23
:
import numpy as np
from matplotlib import pyplot as plt
x = [1,2,3,4]

y_d1 = [7.6, 9.5, 8.5, 6.7]

y_d2 = [8.5, 10.0, 7.2, 9.2]
plt.plot(x, y_d1, label="Top especiais.em des")
plt.plot(x, y_d2, label="ingles")
plt.legend()
plt.title("ana Flavia - top vs. ingles")
plt.xticks((1,2,3,4), ["N1","N2","N3","N4"])
plt.ylim(0,10)
plt.boxplot(x , meanline=True)
plt.show()
print()

import numpy as np

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 16 de 23
:
import matplotlib.pyplot as plt

print('Criando arquivo de números aleatórios...')

graficosFicticios = np.random.randint(0, 5654, size=(3751, 8)) #Cria um array de
print(graficosFicticios) #Imprime o arra criado
print('Salvando o arquivo com as dimensões: ', graficosFicticios.shape)

print('Salvando o arquivo com as dimensões: ', graficosFicticios.shape)

np.savetxt('/content/drive/MyDrive/topicos/graficos-ficticios-01.csv',graficosFi
print('Arquivo .csv salvo com sucesso!')
print('Você poderá ver este arquivo direto no gDrive ou carregando-o em novas se

print('LETRA A)')

#A)

# Selecionar a terceira coluna (índice 2) como x e a quinta coluna (índice 4) co

x = graficosFicticios[:, 2]
y = graficosFicticios[:, 4]

# Plotar o gráfico de dispersão

plt.scatter(x, y)
plt.title('Gráfico de Dispersão')
plt.xlabel('3rd coluna')
plt.ylabel('5th coluna')
plt.show()

print('LETRA B)')

#B)

# Selecionar a sétima coluna (índice 6)

coluna_setima = graficosFicticios[:, 6]

# Plotar o histograma
plt.hist(coluna_setima, bins=20)
plt.title('Histograma da 7th coluna')
plt.xlabel('Valores')
plt.ylabel('Frequência')
plt.show()

print()

# Plotar um gráfico de caixa (box plot) da sétima coluna

plt.boxplot(coluna_setima)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 17 de 23
:
plt.title('Gráfico de Caixa da 7th coluna')
plt.ylabel('Valores')
plt.show()

Criando arquivo de números aleatórios...

[[ 240 5267 4791 ... 1897 4458 1263]
[4228 3195 1186 ... 4243 4651 5222]
[1874 3506 3062 ... 5345 4855 3941]
...
[ 124 5262 1198 ... 1154 4538 5502]
[5320 2139 5158 ... 2890 160 2907]
[5629 2496 884 ... 5411 477 3284]]
Salvando o arquivo com as dimensões: (3751, 8)
Salvando o arquivo com as dimensões: (3751, 8)
Arquivo .csv salvo com sucesso!
Você poderá ver este arquivo direto no gDrive ou carregando-o em novas sess
LETRA A)

LETRA B)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 18 de 23
:
2)

#1)
import numpy as np
import matplotlib.pyplot as plt

from google.colab import drive #Necessario para acessar o gDrive

# Calcular média, valor máximo, valor mínimo e desvio padrão de cada feature
mean_values = np.mean(r, axis=0)
max_values = np.max(r, axis=0)
min_values = np.min(r, axis=0)
std_deviation = np.std(r, axis=0)

# Imprimir os resultados
for i in range(4):
print(f"Feature {i + 1}:")
print(f"Média: {mean_values[i]}")
print(f"Valor Máximo: {max_values[i]}")
print(f"Valor Mínimo: {min_values[i]}")
print(f"Desvio Padrão: {std_deviation[i]}\n")

# Configurar os limites do gráfico

plt.xlim(min_values.min() - 1, max_values.max() + 1)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 19 de 23
:
plt.ylim(min_values.min() - 1, max_values.max() + 1)

# Plot dos dados

plt.scatter(r[:, 0], r[:, 1], c='red', marker='o', label='Feature 1 vs Feature 2
plt.scatter(r[:, 2], r[:, 3], c='blue', marker='x', label='Feature 3 vs Feature

# Adicionar rótulos e legenda

plt.xlabel('Feature 1/3')
plt.ylabel('Feature 2/4')
plt.legend(loc='upper left')

# Mostrar o gráfico
plt.show()

print()
print()

#2)

# Selecionar a primeira e a segunda coluna para X e Y

x = r[:, 0]
y = r[:, 1]

# Gráfico de Linha
plt.figure(figsize=(10, 4))
plt.subplot(131)
plt.plot(x, y, 'r-', label='Linha')
plt.title('Gráfico de Linha')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()

# Gráfico de Dispersão
plt.subplot(132)
plt.scatter(x, y, c='b', marker='o', label='Dispersão')
plt.title('Gráfico de Dispersão')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()

# Gráfico de Barras
plt.subplot(133)
plt.bar(range(len(x)), y, color='g', label='Barras')
plt.title('Gráfico de Barras')

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 20 de 23
:
plt.xlabel('Amostras')
plt.ylabel('Feature 2')
plt.legend()

plt.tight_layout()
plt.show()

print()
print()

#3)

# Selecionar a última coluna

last_column = r[:, -1]

# Criar um histograma
plt.figure(figsize=(12, 4))

plt.subplot(121)
plt.hist(last_column, bins=20, color='skyblue', edgecolor='black')
plt.title('Histograma da Última Coluna')
plt.xlabel('Valor')
plt.ylabel('Frequência')

# Criar um boxplot com média

plt.subplot(122)
plt.boxplot(last_column, vert=False, widths=0.2, patch_artist=True, notch=
plt.title('Boxplot da Última Coluna com Média')
plt.xlabel('Última Coluna')

# Adicionar a média no boxplot

mean_value = np.mean(last_column)
plt.scatter(0, mean_value, color='red', marker='o', s=100, label='Média')
plt.legend()

plt.tight_layout()
plt.show()

Drive already mounted at /content/drive; to attempt to forcibly remount, ca

Carregando arquivo numérico de dados reais Iris
Abaixo estamos carregando os dados na variável r das colunas específicas
(150, 4)
Calculando dados:
Feature 1:
Média: 5.843333333333335
Valor Máximo: 7.9
Valor Mínimo: 4.3

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 21 de 23
:
Valor Mínimo: 4.3
Desvio Padrão: 0.8253012917851409

Feature 2:
Média: 3.0540000000000007
Valor Máximo: 4.4
Valor Mínimo: 2.0
Desvio Padrão: 0.4321465800705435

Feature 3:
Média: 3.7586666666666693
Valor Máximo: 6.9
Valor Mínimo: 1.0
Desvio Padrão: 1.7585291834055201

Feature 4:
Média: 1.1986666666666672
Valor Máximo: 2.5
Valor Mínimo: 0.1
Desvio Padrão: 0.760612618588172

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 22 de 23
:
https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 23 de 23
:

AulasManuelB3.Ipynb - Colaboratory 2

Enviado por

AulasManuelB3.Ipynb - Colaboratory 2

Enviado por

from google.colab import drive #importar a biblioteca drive de google.

Drive already mounted at /content/drive; to attempt to forcibly remount, ca

from google.colab import drive #Necessario para acessar o gDrive

fim do loop estartístico...

fim do loop estartístico...

fim do loop estartístico...

fim do loop estartístico...

print("Calculando dados: ")

from google.colab import drive #Necessario para acessar o gDrive

print("Calculando dados: ")

Drive already mounted at /content/drive; to attempt to forcibly remount, ca

Desvio padrão coluna 1 foi 4.998450415489925:

Desvio padrão coluna 2 foi 22.427860307100534:

Desvio padrão coluna 3 foi 10.024278156632223:

Desvio padrão coluna 4 foi 3.626310750341434:

Desvio padrão coluna 5 foi 19.100428483698998:

Desvio padrão coluna 6 foi 6.813780440401913:

Desvio padrão coluna 8 foi 344.41843310309287:

Fim do loop eststístico...

import matplotlib.pyplot as plt

f = [1.68, 1.70, 1.60, 1.50, 1.82, 1.69,]

y_d1 = [7.6, 9.5, 8.5, 6.7]

print('Criando arquivo de números aleatórios...')

print('Salvando o arquivo com as dimensões: ', graficosFicticios.shape)

# Selecionar a terceira coluna (índice 2) como x e a quinta coluna (índice 4) co

# Plotar o gráfico de dispersão

# Selecionar a sétima coluna (índice 6)

# Plotar um gráfico de caixa (box plot) da sétima coluna

Criando arquivo de números aleatórios...

from google.colab import drive #Necessario para acessar o gDrive

# Configurar os limites do gráfico

# Plot dos dados

# Adicionar rótulos e legenda

# Selecionar a primeira e a segunda coluna para X e Y

# Selecionar a última coluna

# Criar um boxplot com média

# Adicionar a média no boxplot

Drive already mounted at /content/drive; to attempt to forcibly remount, ca

Você também pode gostar

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.