0% acharam este documento útil (0 voto)
45 visualizações23 páginas

AulasManuelB3.Ipynb - Colaboratory 2

O documento descreve como carregar dados numéricos de um arquivo CSV no Google Drive, calcular estatísticas descritivas sobre as colunas, separar os dados em conjuntos de treino e teste, e salvar os conjuntos no Drive. Primeiro, importa bibliotecas como drive e numpy, carrega os dados do arquivo CSV, e calcula estatísticas como média, desvio padrão, mínimo e máximo para cada coluna. Em seguida, separa 80% dos dados para treino e 20% para teste, e salva os conjuntos no Drive.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
45 visualizações23 páginas

AulasManuelB3.Ipynb - Colaboratory 2

O documento descreve como carregar dados numéricos de um arquivo CSV no Google Drive, calcular estatísticas descritivas sobre as colunas, separar os dados em conjuntos de treino e teste, e salvar os conjuntos no Drive. Primeiro, importa bibliotecas como drive e numpy, carrega os dados do arquivo CSV, e calcula estatísticas como média, desvio padrão, mínimo e máximo para cada coluna. Em seguida, separa 80% dos dados para treino e 20% para teste, e salva os conjuntos no Drive.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 23

from google.colab import drive #importar a biblioteca drive de google.

colab
drive.mount('/content/drive') #Liga o seu gDrive a um caminho padrão
import numpy as np #Importamos o numpy e seguimos normalmente
print('Criando arquivo de números aleatórios...')
meuarray = np.random.randint(1,80, 1000).reshape((100,10)) #Cria um array de dim
print(meuarray) #Imprime o arra criado
print('Salvando o arquivo com as dimensões: ', meuarray.shape)
np.savetxt('/content/drive/MyDrive/meuarray.csv', meuarray, delimiter=",") #Salv
print('Arquivo .csv salvo com sucesso!')
print('Você poderá ver este arquivo direto no gDrive ou carregando-o em novas se

Drive already mounted at /content/drive; to attempt to forcibly remount, ca


Criando arquivo de números aleatórios...
[[20 27 77 39 19 79 67 46 40 60]
[19 68 33 36 16 71 55 4 28 13]
[31 43 14 70 60 67 47 16 71 76]
[65 24 24 63 79 50 54 57 1 41]
[35 57 13 40 18 24 39 60 55 45]
[71 28 52 6 68 45 64 61 16 21]
[38 68 63 64 67 35 70 41 69 46]
[64 46 52 61 74 34 22 37 59 29]
[ 7 60 56 23 33 27 45 42 39 60]
[46 44 64 44 78 47 41 38 35 1]
[51 47 13 65 59 35 22 72 1 8]
[77 60 1 21 65 8 23 52 8 28]
[48 56 17 72 53 70 13 5 14 41]
[21 6 48 34 8 35 67 43 70 2]
[79 32 6 56 10 20 23 33 40 47]
[74 33 44 48 70 78 42 18 5 29]
[63 53 6 37 59 54 20 36 55 75]
[35 15 61 70 42 76 18 2 72 49]
[65 15 29 39 47 59 58 66 25 18]
[74 23 51 27 48 9 66 27 19 13]
[24 68 77 58 27 67 43 38 64 3]
[40 39 1 46 32 9 72 70 48 8]
[28 70 57 40 76 38 29 56 18 45]
[36 24 29 29 47 6 49 67 73 19]
[48 20 55 36 19 67 57 65 61 73]
[20 21 19 10 9 24 17 27 40 31]
[45 6 12 51 53 29 41 36 18 36]
[37 36 39 7 78 23 19 23 39 65]
[76 67 14 28 18 57 68 74 12 46]
[58 29 3 12 79 10 18 52 73 76]
[34 72 18 6 7 56 17 65 54 27]
[59 21 17 69 32 17 4 42 77 52]
[65 25 19 4 73 72 15 67 55 15]
[24 31 10 65 14 26 36 9 44 1]
[69 74 55 79 13 13 36 49 50 6]

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 1 de 23
:
[28 76 63 14 42 49 9 3 47 64]
[ 7 64 53 62 6 54 31 28 61 46]
[31 32 60 14 71 39 61 40 45 16]
[46 64 41 42 74 27 54 15 76 33]
[30 45 23 27 2 44 24 1 18 8]
[16 4 11 65 26 50 2 65 8 4]
[43 50 57 60 44 30 28 50 73 53]
[74 67 56 32 8 36 9 28 23 55]
[48 9 26 11 65 73 23 58 6 30]
[20 11 36 38 31 23 65 56 30 41]
[31 13 67 58 23 40 72 1 63 43]
[17 54 15 25 10 64 24 30 36 64]
[22 3 47 12 73 58 1 16 66 48]
[18 12 23 7 24 21 78 17 30 58]
[79 24 78 76 64 21 47 40 48 37]
[ 6 13 64 72 79 32 29 51 27 41]
[47 24 41 13 59 53 14 71 15 59]
[79 25 24 75 36 12 50 36 73 56]
[11 64 26 2 42 1 24 56 74 43]
[18 71 74 46 69 26 53 62 33 31]
[50 3 47 39 63 52 68 69 71 29]
[64 31 5 13 19 17 6 23 61 48]

from google.colab import drive #Necessario para acessar o gDrive


drive.mount('/content/drive') #Necessário para acessar o gDrive
import numpy as np #Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais Iris')
print('Abaixo estamos carregando os dados na variável r das colunas específicas'
r = np.loadtxt('/content/drive/MyDrive/iris/iris.data', delimiter = "," ,usecols
print(r.shape) #Daqui em diante pode-se fazer qualquer operação como slices e ca
print('Calculando dados: ')
n_cols = r.shape[1]
for col in range(n_cols):
print('desvio padrão coluna %s foi %s: ' % (col, r[ : , col]. std()))
print('Media coluna %s foi %s: ' % (col, r[ : , col]. mean()))
print('valor minino da coluna %s foi %s: ' % (col, r[ : , col].
max()))
print('valor minino da coluna %s foi %s: ' % (col, r[ : , col]. min()))
print()
print('fim do loop estartístico...')
print('separando 120 registros -= 80% do dataset...')
r80 = r[0:119 , : ]
r20 = r[0:120 , : ]
print('Dimençoes do 80%: ', r80.shape)
print('Dimençoes do 20%: ', r20.shape)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 2 de 23
:
Drive already mounted at /content/drive; to attempt to forcibly remount, ca
Carregando arquivo numérico de dados reais Iris
Abaixo estamos carregando os dados na variável r das colunas específicas
(150, 4)
Calculando dados:
desvio padrão coluna 0 foi 0.8253012917851409:
Media coluna 0 foi 5.843333333333334:
valor minino da coluna 0 foi 7.9:
valor minino da coluna 0 foi 4.3:

fim do loop estartístico...


desvio padrão coluna 1 foi 0.4321465800705435:
Media coluna 1 foi 3.0540000000000003:
valor minino da coluna 1 foi 4.4:
valor minino da coluna 1 foi 2.0:

fim do loop estartístico...


desvio padrão coluna 2 foi 1.7585291834055212:
Media coluna 2 foi 3.758666666666666:
valor minino da coluna 2 foi 6.9:
valor minino da coluna 2 foi 1.0:

fim do loop estartístico...


desvio padrão coluna 3 foi 0.7606126185881716:
Media coluna 3 foi 1.1986666666666668:
valor minino da coluna 3 foi 2.5:
valor minino da coluna 3 foi 0.1:

fim do loop estartístico...


separando 120 registros -= 80% do dataset...
Dimençoes do 80%: (119, 4)
Dimençoes do 20%: (120, 4)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 3 de 23
:
from google.colab import drive #Necessario para acessar o gDrive
drive.mount("/content/drive")#Necessário para acessar o gDrive
import numpy as np#Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais')
print("Abaixo estamos carregando os dados na variável r das colunas específicas"
r = np.loadtxt("/content/drive/MyDrive/dados/dataR2.csv", delimiter = ","
print(r.shape) #Daqui em diante pode-se

print("Calculando dados: ")


n_cols = r.shape[-1]
for col in range(n_cols-1):
print("Desvio padrão coluna %s foi %s: " % (col , r[ : , col ].std()))
print("Media coluna %s foi %s: " % (col , r[ : , col ].mean()))
print("Valor máximo da coluna %s foi %s: " % (col , r[ : , col ].max()))
print("Valor mínimo da coluna %s foi %s: " % (col , r[ : , col ].min()))
print()
print("Fim do loop eststístico...")
print("Separando 120 registros ~= 80% do dataset...")
r80 = r[0:93 , : ]
r20 = r[94: , : ]
print("Dimensoes do 80%: ", r80.shape)
print("Dimensoes do 20%: ", r20.shape)
print("Salvando arquivos no Drive...")
np.savetxt("/content/drive/MyDrive/dados/dataR2.csv", r80, delimiter = ","
np.savetxt("/content/drive/MyDrive/dados/dataR2.csv", r20, delimiter = ","
print("Arquivos salvos, verifique o seu gdrive....")

from google.colab import drive #Necessario para acessar o gDrive


drive.mount("/content/drive")#Necessário para acessar o gDrive
import numpy as np#Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais')
print("Abaixo estamos carregando os dados na variável r das colunas específicas"
r = np.loadtxt("/content/drive/MyDrive/dados/dataR2.csv", delimiter = ","
print(r.shape) #Daqui em diante pode-se

print("Calculando dados: ")


n_cols = r.shape[1]
for col in range(n_cols -1):
print("Desvio padrão coluna %s foi %s: " % (col , r[ : , col ].std()))
print("Media coluna %s foi %s: " % (col , r[ : , col ].mean()))
print("Valor máximo da coluna %s foi %s: " % (col , r[ : , col ].max()))
print("Valor mínimo da coluna %s foi %s: " % (col , r[ : , col ].min()))
print()
print("Fim do loop eststístico...")

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 4 de 23
:
print("Separando 120 registros ~= 80% do dataset...")
r80 = r[0:93 , : ]
r20 = r[94: , : ]
print("Dimensoes do 80%: ", r80.shape)
print("Dimensoes do 20%: ", r20.shape)
print("Salvando arquivos no Drive...")
np.savetxt("/content/drive/MyDrive/dados/bcancer-80.csv", r80, delimiter =
np.savetxt("/content/drive/MyDrive/dados/bcancer-20.csv", r20, delimiter =
print("Arquivos salvos, verifique o seu gdrive....")

Drive already mounted at /content/drive; to attempt to forcibly remount, ca


Carregando arquivo numérico de dados reais Iris
Abaixo estamos carregando os dados na variável r das colunas específicas
(116, 10)
Calculando dados:
Desvio padrão coluna 0 foi 16.043163667918627:
Media coluna 0 foi 57.30172413793103:
Valor máximo da coluna 0 foi 89.0:
Valor mínimo da coluna 0 foi 24.0:

Desvio padrão coluna 1 foi 4.998450415489925:


Media coluna 1 foi 27.582110827413796:
Valor máximo da coluna 1 foi 38.57875854:
Valor mínimo da coluna 1 foi 18.37:

Desvio padrão coluna 2 foi 22.427860307100534:


Media coluna 2 foi 97.79310344827586:
Valor máximo da coluna 2 foi 201.0:
Valor mínimo da coluna 2 foi 60.0:

Desvio padrão coluna 3 foi 10.024278156632223:


Media coluna 3 foi 10.012086206896551:
Valor máximo da coluna 3 foi 58.46:
Valor mínimo da coluna 3 foi 2.432:

Desvio padrão coluna 4 foi 3.626310750341434:


Media coluna 4 foi 2.694987564396551:
Valor máximo da coluna 4 foi 25.05034187:
Valor mínimo da coluna 4 foi 0.467408667:

Desvio padrão coluna 5 foi 19.100428483698998:


Media coluna 5 foi 26.61508017241379:
Valor máximo da coluna 5 foi 90.28:
Valor mínimo da coluna 5 foi 4.311:

Desvio padrão coluna 6 foi 6.813780440401913:


Media coluna 6 foi 10.180873965517241:
Valor máximo da coluna 6 foi 38.04:
Valor mínimo da coluna 6 foi 1.65602:

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 5 de 23
:
Desvio padrão coluna 7 foi 12.337122119975472:
Media coluna 7 foi 14.725965862068962:
Valor máximo da coluna 7 foi 82.1:
Valor mínimo da coluna 7 foi 3.21:

Desvio padrão coluna 8 foi 344.41843310309287:


Media coluna 8 foi 534.647:
Valor máximo da coluna 8 foi 1698.44:
Valor mínimo da coluna 8 foi 45.843:

Fim do loop eststístico...


Separando 120 registros ~= 80% do dataset...
Dimensoes do 80%: (93, 10)
Dimensoes do 20%: (22, 10)
Salvando arquivos no Drive...
Arquivos salvos, verifique o seu gdrive....

import matplotlib.pyplot as plt


year = [1950, 1970, 1990, 2010]
pop = [2.519, 3.692, 5.263, 6.972]
plt.scatter(year, pop)
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 6 de 23
:
import matplotlib.pyplot as plt
x = [1,2,3,4]
Y = [2,3,4,3]
plt.bar(x,Y)
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 7 de 23
:
values = [0,0.6,1.4,1.6,2.2,2.5,2.6,3.2,3.5,3.9,4.2,6]
plt.hist(values, bins = 3) #bins indica quantas barras
plt.show() #exibe o plot

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 8 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 9 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
#Nas próximas duas linhas customizamos
plt.xlabel('Ano')
plt.ylabel('População')
plt.show() #Exibe o gráfico

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 10 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
#A partir daqui temos as customizações no .plt
plt.xlabel('Ano')
plt.ylabel('População')
plt.title('Projeções para população mundial')
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 11 de 23
:
import matplotlib.pyplot as plt
year = [1950, 1970, 1990, 2010, 2020]
pop = [2.519, 3.692, 5.263, 6.972, 10.33]
plt.plot(year, pop)
#A partir daqui temos as customizações no .plt
plt.xlabel('Ano')
plt.ylabel('População')
plt.title('Projeções para população mundial')
plt.yticks([0, 2, 4, 6, 8, 10])
plt.show()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 12 de 23
:
import numpy as np
from matplotlib import pyplot as plt

a = np.random.randint(0,5999,30008).reshape((3751,8))
print(a.shape)
x = a[ : , 2]
y = a[: , 4]

f = [1.68, 1.70, 1.60, 1.50, 1.82, 1.69,]

plt.plot(x,y)
plt.title("Grafico de linhas")
plt.xlabel("terceira coluna")
plt.ylabel("quinta coluna")
plt.show()
print()

(3751, 8)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 13 de 23
:
import numpy as np
from matplotlib import pyplot as plt
f = [1.68,1.70, 1.55, 1.56, 1.60, 1.58, 1.82, 2.6]
plt.boxplot(f , meanline=True)
plt.show()
print()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 14 de 23
:
import numpy as np
from matplotlib import pyplot as plt
f = [1.68,1.70, 1.55, 1.56, 1.60, 1.58, 1.82, 2.6, 1,68, 1.68, 1.68, 1.94,
plt.hist(f, bins=4)
plt.show()
print()

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 15 de 23
:
import numpy as np
from matplotlib import pyplot as plt
x = [1,2,3,4]

y_d1 = [7.6, 9.5, 8.5, 6.7]


y_d2 = [8.5, 10.0, 7.2, 9.2]
plt.plot(x, y_d1, label="Top especiais.em des")
plt.plot(x, y_d2, label="ingles")
plt.legend()
plt.title("ana Flavia - top vs. ingles")
plt.xticks((1,2,3,4), ["N1","N2","N3","N4"])
plt.ylim(0,10)
plt.boxplot(x , meanline=True)
plt.show()
print()

1)

import numpy as np

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 16 de 23
:
import matplotlib.pyplot as plt

print('Criando arquivo de números aleatórios...')


graficosFicticios = np.random.randint(0, 5654, size=(3751, 8)) #Cria um array de
print(graficosFicticios) #Imprime o arra criado
print('Salvando o arquivo com as dimensões: ', graficosFicticios.shape)

print('Salvando o arquivo com as dimensões: ', graficosFicticios.shape)


np.savetxt('/content/drive/MyDrive/topicos/graficos-ficticios-01.csv',graficosFi
print('Arquivo .csv salvo com sucesso!')
print('Você poderá ver este arquivo direto no gDrive ou carregando-o em novas se

print('LETRA A)')

#A)

# Selecionar a terceira coluna (índice 2) como x e a quinta coluna (índice 4) co


x = graficosFicticios[:, 2]
y = graficosFicticios[:, 4]

# Plotar o gráfico de dispersão


plt.scatter(x, y)
plt.title('Gráfico de Dispersão')
plt.xlabel('3rd coluna')
plt.ylabel('5th coluna')
plt.show()

print('LETRA B)')

#B)

# Selecionar a sétima coluna (índice 6)


coluna_setima = graficosFicticios[:, 6]

# Plotar o histograma
plt.hist(coluna_setima, bins=20)
plt.title('Histograma da 7th coluna')
plt.xlabel('Valores')
plt.ylabel('Frequência')
plt.show()

print()

# Plotar um gráfico de caixa (box plot) da sétima coluna


plt.boxplot(coluna_setima)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 17 de 23
:
plt.title('Gráfico de Caixa da 7th coluna')
plt.ylabel('Valores')
plt.show()

Criando arquivo de números aleatórios...


[[ 240 5267 4791 ... 1897 4458 1263]
[4228 3195 1186 ... 4243 4651 5222]
[1874 3506 3062 ... 5345 4855 3941]
...
[ 124 5262 1198 ... 1154 4538 5502]
[5320 2139 5158 ... 2890 160 2907]
[5629 2496 884 ... 5411 477 3284]]
Salvando o arquivo com as dimensões: (3751, 8)
Salvando o arquivo com as dimensões: (3751, 8)
Arquivo .csv salvo com sucesso!
Você poderá ver este arquivo direto no gDrive ou carregando-o em novas sess
LETRA A)

LETRA B)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 18 de 23
:
2)

#1)
import numpy as np
import matplotlib.pyplot as plt

from google.colab import drive #Necessario para acessar o gDrive


drive.mount('/content/drive') #Necessário para acessar o gDrive
import numpy as np #Código normal para usar o NumPy ou outra biblioteca
print('Carregando arquivo numérico de dados reais Iris')
print('Abaixo estamos carregando os dados na variável r das colunas específicas'
r = np.loadtxt('/content/drive/MyDrive/iris/iris.data', delimiter = "," ,usecols
print(r.shape) #Daqui em diante pode-se fazer qualquer operação como slices e ca
print('Calculando dados: ')
n_cols = r.shape[1]

# Calcular média, valor máximo, valor mínimo e desvio padrão de cada feature
mean_values = np.mean(r, axis=0)
max_values = np.max(r, axis=0)
min_values = np.min(r, axis=0)
std_deviation = np.std(r, axis=0)

# Imprimir os resultados
for i in range(4):
print(f"Feature {i + 1}:")
print(f"Média: {mean_values[i]}")
print(f"Valor Máximo: {max_values[i]}")
print(f"Valor Mínimo: {min_values[i]}")
print(f"Desvio Padrão: {std_deviation[i]}\n")

# Configurar os limites do gráfico


plt.xlim(min_values.min() - 1, max_values.max() + 1)

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 19 de 23
:
plt.ylim(min_values.min() - 1, max_values.max() + 1)

# Plot dos dados


plt.scatter(r[:, 0], r[:, 1], c='red', marker='o', label='Feature 1 vs Feature 2
plt.scatter(r[:, 2], r[:, 3], c='blue', marker='x', label='Feature 3 vs Feature

# Adicionar rótulos e legenda


plt.xlabel('Feature 1/3')
plt.ylabel('Feature 2/4')
plt.legend(loc='upper left')

# Mostrar o gráfico
plt.show()

print()
print()

#2)

# Selecionar a primeira e a segunda coluna para X e Y


x = r[:, 0]
y = r[:, 1]

# Gráfico de Linha
plt.figure(figsize=(10, 4))
plt.subplot(131)
plt.plot(x, y, 'r-', label='Linha')
plt.title('Gráfico de Linha')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()

# Gráfico de Dispersão
plt.subplot(132)
plt.scatter(x, y, c='b', marker='o', label='Dispersão')
plt.title('Gráfico de Dispersão')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()

# Gráfico de Barras
plt.subplot(133)
plt.bar(range(len(x)), y, color='g', label='Barras')
plt.title('Gráfico de Barras')

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 20 de 23
:
plt.xlabel('Amostras')
plt.ylabel('Feature 2')
plt.legend()

plt.tight_layout()
plt.show()

print()
print()

#3)

# Selecionar a última coluna


last_column = r[:, -1]

# Criar um histograma
plt.figure(figsize=(12, 4))

plt.subplot(121)
plt.hist(last_column, bins=20, color='skyblue', edgecolor='black')
plt.title('Histograma da Última Coluna')
plt.xlabel('Valor')
plt.ylabel('Frequência')

# Criar um boxplot com média


plt.subplot(122)
plt.boxplot(last_column, vert=False, widths=0.2, patch_artist=True, notch=
plt.title('Boxplot da Última Coluna com Média')
plt.xlabel('Última Coluna')

# Adicionar a média no boxplot


mean_value = np.mean(last_column)
plt.scatter(0, mean_value, color='red', marker='o', s=100, label='Média')
plt.legend()

plt.tight_layout()
plt.show()

Drive already mounted at /content/drive; to attempt to forcibly remount, ca


Carregando arquivo numérico de dados reais Iris
Abaixo estamos carregando os dados na variável r das colunas específicas
(150, 4)
Calculando dados:
Feature 1:
Média: 5.843333333333335
Valor Máximo: 7.9
Valor Mínimo: 4.3

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 21 de 23
:
Valor Mínimo: 4.3
Desvio Padrão: 0.8253012917851409

Feature 2:
Média: 3.0540000000000007
Valor Máximo: 4.4
Valor Mínimo: 2.0
Desvio Padrão: 0.4321465800705435

Feature 3:
Média: 3.7586666666666693
Valor Máximo: 6.9
Valor Mínimo: 1.0
Desvio Padrão: 1.7585291834055201

Feature 4:
Média: 1.1986666666666672
Valor Máximo: 2.5
Valor Mínimo: 0.1
Desvio Padrão: 0.760612618588172

https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 22 de 23
:
https://colab.research.google.com/drive/1HtHigAZksPboP-7d18T5Um4uo-bbCWjm?usp=sharing 09/10/2023, 20 56
Página 23 de 23
:

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy