0% found this document useful (0 votes)

5 views4 pages

Dream Team

The document outlines a Python script that utilizes Selenium and Pandas to scrape cricket player statistics from a website, processes the data into a DataFrame, and performs linear regression and ridge regression to predict future performance metrics for players. It includes steps for data extraction, cleaning, and merging batting and bowling statistics, followed by model training and evaluation. Finally, it generates predictions for various performance metrics based on historical data.

Uploaded by

995aarvee

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views4 pages

Dream Team

Uploaded by

995aarvee

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 4

import pandas as pd

import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

# Initialize webdriver
driver = webdriver.Chrome()

final_data = pd.DataFrame()

# Sample URL used in the example (update with the actual player URLs)
driver.get("http://www.cricmetric.com/playerstats.py?
player=KA+Pollard&role=all&format=T20I&groupby=match&start_date=2021-10-
17&end_date=2022-10-17")

# List of players to iterate over (update this list with actual player names or
IDs)
players = ["player1", "player2", "player3"] # Example players

for i in players:
driver.find_element_by_xpath('//*[@id="player"]').clear()
driver.find_element_by_xpath('//*[@id="player"]').send_keys(i)
try:
driver.find_element_by_xpath('/html/body/div[1]/div[1]/div[2]/div/form/
input[3]').click()
except:
driver.find_element_by_xpath('/html/body/div[1]/div[1]/div[2]/div/form/
input[3]').click()
time.sleep(3)
try:
# Batting data
bat =
driver.find_element_by_xpath('//*[@id="T20I-Batting"]/div/table').text
stats = pd.DataFrame(bat.split('\n')[0].str.split(',', expand=True)[0:-1])
stats.columns = stats.iloc[0]
stats = stats[1:]
del stats['%']
stats = stats[['Match', 'Runs', 'Balls', 'Out', '4s', '6s', 'Dot']]
stats.columns = ['Match', 'Runs Scored', 'Balls Played', 'Out', 'Bat SR',
'50', '100', '4s Scored', '6s Scored', 'Bat Dot%']
time.sleep(5)
except:
continue

try:
# Bowling data
bowl =
driver.find_element_by_xpath('//*[@id="T20I-Bowling"]/div/table').text
stats2 = pd.DataFrame(bowl.split('\n')[0].str.split(',', expand=True)[0:-
1])
stats2.columns = stats2.iloc[0]
stats2 = stats2[1:]
stats2 = stats2[['Match', 'Overs', 'Runs', 'Wickets', 'Econ', 'SR', '5W',
'4s', '6s', 'Dot%']]
stats2.columns = ['Match', 'Overs Bowled', 'Runs Given', 'Wickets Taken',
'Econ', 'Bowl Avg', 'Bowl SR', '5W', '4s Given', '6s Given']
except:
stats2 = pd.DataFrame({'Match': [], 'Overs Bowled': [], 'Runs Given': [],
'Wickets Taken': [], 'Econ': [], 'Bowl Avg': [], 'Bowl SR': [], '5W': [], '4s
Given': [], '6s Given': []})

overall = pd.merge(stats, stats2, on='Match')

overall['overall'] = overall['Runs Scored'] + overall['Wickets Taken'] #
Example calculation
overall = overall.sort_values(by='Match')
overall.insert(0, 'Player', i)
overall = overall.fillna(0)
final_data = final_data.append(overall)

final_data

from sklearn.model_selection import train_test_split

from sklearn import linear_model

# Assuming 'model1_df' is the DataFrame containing the data

# Ensure 'model1_df' is defined before running this code

# Linear Regression
# Fitting the model and checking accuracy

X = model1_df[model1_df.columns[1:-1]]
y = model1_df[model1_df.columns[-1]]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=9999)

points_model = linear_model.LinearRegression().fit(X_train, y_train)

print('Training set accuracy:', points_model.score(X_train, y_train))

print('Test set accuracy:', points_model.score(X_test, y_test))

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn import linear_model

# Using ridge regression to predict the next match's performance based on the same
player's performance in past
models = pd.DataFrame()

for i in players_list:
player = final_data[final_data['Player'] == i]
player_new = player.dropna()

X = player_new[player_new.columns[2:11]]
y = player_new[player_new.columns[22:23]]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

ridge = pd.DataFrame()
for j in range(0, 101):
points = linear_model.Ridge(alpha=j).fit(X_train, y_train)
ridge_df = pd.DataFrame({'Alpha': pd.Series(j), 'Train':
pd.Series(points.score(X_train, y_train)), 'Test': pd.Series(points.score(X_test,
y_test))})
ridge = ridge.append(ridge_df)
ridge['Average'] = ridge[['Train', 'Test']].mean(axis=1)
try:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
except:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
next_runs = linear_model.Ridge(alpha=k)
next_runs.fit(X_train, y_train)

X = player_new[player_new.columns[11:21]]
y = player_new[player_new.columns[22:23]]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

ridge = pd.DataFrame()
for j in range(0, 101):
points = linear_model.Ridge(alpha=j).fit(X_train, y_train)
ridge_df = pd.DataFrame({'Alpha': pd.Series(j), 'Train':
pd.Series(points.score(X_train, y_train)), 'Test': pd.Series(points.score(X_test,
y_test))})
ridge = ridge.append(ridge_df)
ridge['Average'] = ridge[['Train', 'Test']].mean(axis=1)
try:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
except:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
next_balls = linear_model.Ridge(alpha=k)
next_balls.fit(X_train, y_train)

X = player_new[player_new.columns[11:21]]
y = player_new[player_new.columns[25:26]]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

ridge = pd.DataFrame()
for j in range(0, 101):
points = linear_model.Ridge(alpha=j).fit(X_train, y_train)
ridge_df = pd.DataFrame({'Alpha': pd.Series(j), 'Train':
pd.Series(points.score(X_train, y_train)), 'Test': pd.Series(points.score(X_test,
y_test))})
ridge = ridge.append(ridge_df)
ridge['Average'] = ridge[['Train', 'Test']].mean(axis=1)
try:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
except:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
next_wkts = linear_model.Ridge(alpha=k)
next_wkts.fit(X_train, y_train)

X = player_new[player_new.columns[11:21]]
y = player_new[player_new.columns[24:25]]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

ridge = pd.DataFrame()
for j in range(0, 101):
points = linear_model.Ridge(alpha=j).fit(X_train, y_train)
ridge_df = pd.DataFrame({'Alpha': pd.Series(j), 'Train':
pd.Series(points.score(X_train, y_train)), 'Test': pd.Series(points.score(X_test,
y_test))})
ridge = ridge.append(ridge_df)
ridge['Average'] = ridge[['Train', 'Test']].mean(axis=1)
try:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
except:
k = ridge[ridge['Average'] == ridge['Average'].max()]['Alpha'][0]
next_overs = linear_model.Ridge(alpha=k)
next_overs.fit(X_train, y_train)

X = player_new[player_new.columns[11:21]]
y = player_new[player_new.columns[24:25]]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

latest = player.groupby('Player').tail(1)
next_runs_given = next_runs.predict(latest[latest.columns[11:21]])
next_balls_faced = next_balls.predict(latest[latest.columns[11:21]])
next_wkts_taken = next_wkts.predict(latest[latest.columns[11:21]])
next_overs_faced = next_overs.predict(latest[latest.columns[11:21]])

models.at[i, 'next_runs_given'] = round(next_runs_given[0], 0)

models.at[i, 'next_balls_faced'] = round(next_balls_faced[0], 0)
models.at[i, 'next_wkts_taken'] = round(next_wkts_taken[0], 0)
models.at[i, 'next_overs_faced'] = round(next_overs_faced[0], 0)
models.at[i, 'next_runs_given'] = round(next_runs_given[0], 0)
models.at[i, 'next_balls_faced'] = round(next_balls_faced[0], 0)
models.at[i, 'next_wkts_taken'] = round(next_wkts_taken[0], 0)
models.at[i, 'next_overs_faced'] = round(next_overs_faced[0], 0)

# Display the models DataFrame with predictions

print(models)

Invoice Jio Fi
No ratings yet
Invoice Jio Fi
1 page
Reading Comprehension Passages
No ratings yet
Reading Comprehension Passages
25 pages
Q7 Xenon
No ratings yet
Q7 Xenon
7 pages
# Update The Template To Remove Pla
No ratings yet
# Update The Template To Remove Pla
2 pages
Astros
No ratings yet
Astros
20 pages
PandasAI + Cricket
No ratings yet
PandasAI + Cricket
10 pages
IPL Score Prediction - Ipynb - Colab
No ratings yet
IPL Score Prediction - Ipynb - Colab
3 pages
Kaggle Kernel - Mens-Machine-Learning-Competition-2019 - Page1 (Etc.) (Z-Library)
No ratings yet
Kaggle Kernel - Mens-Machine-Learning-Competition-2019 - Page1 (Etc.) (Z-Library)
325 pages
Ipl Data Analysis
No ratings yet
Ipl Data Analysis
19 pages
IPL Data Analysis
100% (1)
IPL Data Analysis
26 pages
Dream Team 11
No ratings yet
Dream Team 11
6 pages
ML 1
No ratings yet
ML 1
16 pages
NBA Games Prediction 1683875972
No ratings yet
NBA Games Prediction 1683875972
11 pages
INFO II Practice 7
No ratings yet
INFO II Practice 7
15 pages
SREE
No ratings yet
SREE
24 pages
To Collect Bowling Data
No ratings yet
To Collect Bowling Data
2 pages
Code2pdf 6714bd5247d05
No ratings yet
Code2pdf 6714bd5247d05
3 pages
Phil Salt T20 Career Analysis
No ratings yet
Phil Salt T20 Career Analysis
38 pages
Import As Import As From Import Import As Matplotlib Import Import
No ratings yet
Import As Import As From Import Import As Matplotlib Import Import
5 pages
Codefile
No ratings yet
Codefile
4 pages
24 Gourav
No ratings yet
24 Gourav
75 pages
Clustering Code Explaination
No ratings yet
Clustering Code Explaination
3 pages
ML Lab A1 A4
No ratings yet
ML Lab A1 A4
6 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
Ip Project
No ratings yet
Ip Project
20 pages
Informatics Practices Project File PDF
0% (1)
Informatics Practices Project File PDF
45 pages
Indian Premier League Ip Project File
No ratings yet
Indian Premier League Ip Project File
42 pages
Advanced ML PDF
No ratings yet
Advanced ML PDF
25 pages
IP PROJECT On Ipl Sahil Uppal
No ratings yet
IP PROJECT On Ipl Sahil Uppal
27 pages
Output Code
No ratings yet
Output Code
2 pages
Ipl Data Analysis Porgram
No ratings yet
Ipl Data Analysis Porgram
6 pages
RAKESH
No ratings yet
RAKESH
24 pages
IPL - Prediction - Model - Training - Final - Ipynb - Colab
No ratings yet
IPL - Prediction - Model - Training - Final - Ipynb - Colab
8 pages
DM Lab 7.ipynb - Colaboratory
No ratings yet
DM Lab 7.ipynb - Colaboratory
3 pages
Ipl Data Anlysis
No ratings yet
Ipl Data Anlysis
20 pages
正規化411210002
No ratings yet
正規化411210002
8 pages
MLLAB
No ratings yet
MLLAB
10 pages
Final Prjoect
No ratings yet
Final Prjoect
32 pages
Q2.ipynb - Colab
No ratings yet
Q2.ipynb - Colab
3 pages
Virat Kohil
No ratings yet
Virat Kohil
31 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
ML Lab Prgms Split
No ratings yet
ML Lab Prgms Split
3 pages
21CSC305P ML - Lab Programs 1 - 9
No ratings yet
21CSC305P ML - Lab Programs 1 - 9
36 pages
Report
No ratings yet
Report
8 pages
Cricket Team Recommendation System Using Machine Learning Algorithm
No ratings yet
Cricket Team Recommendation System Using Machine Learning Algorithm
26 pages
1
No ratings yet
1
13 pages
正規化411210002
No ratings yet
正規化411210002
8 pages
15BCE0435 - Lab 3
No ratings yet
15BCE0435 - Lab 3
1 page
Data Science Lab Experiments
No ratings yet
Data Science Lab Experiments
32 pages
Ex 3
No ratings yet
Ex 3
5 pages
Regression Model
No ratings yet
Regression Model
6 pages
Pad Assignment No - 01
No ratings yet
Pad Assignment No - 01
6 pages
Is MS Dhoni Good Enough To Bat Assignment
No ratings yet
Is MS Dhoni Good Enough To Bat Assignment
24 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
ML Labs
No ratings yet
ML Labs
14 pages
Estats: June 19, 2019
No ratings yet
Estats: June 19, 2019
33 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
Machine File
No ratings yet
Machine File
27 pages
No Ph.D. Game Design With Three.js
From Everand
No Ph.D. Game Design With Three.js
Nikiforos Kontopoulos
No ratings yet
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet
Big Data Nalysis
No ratings yet
Big Data Nalysis
2 pages
Smart Player Rotation Strategy (22 Players 20 Teams)
No ratings yet
Smart Player Rotation Strategy (22 Players 20 Teams)
3 pages
PSC I Girder Comparison
No ratings yet
PSC I Girder Comparison
1 page
DS3CD - W2D2 7th Jan
No ratings yet
DS3CD - W2D2 7th Jan
4 pages
Clab 2 Expt No 6
No ratings yet
Clab 2 Expt No 6
7 pages
7 12
No ratings yet
7 12
2 pages
7 12
No ratings yet
7 12
2 pages
Feasibility Study: Dr. R Bista Ms Gyan Laxmi Shrestha Basic Administration Project 2017
No ratings yet
Feasibility Study: Dr. R Bista Ms Gyan Laxmi Shrestha Basic Administration Project 2017
22 pages
Mom
No ratings yet
Mom
6 pages
Circular - Recovery of Centages DDF Scheme Works - 24007 - 29.06 PDF
100% (1)
Circular - Recovery of Centages DDF Scheme Works - 24007 - 29.06 PDF
2 pages
Proposed Methodology For Prioritization of Investment Projects Along Selected Euro-Asian Routes
No ratings yet
Proposed Methodology For Prioritization of Investment Projects Along Selected Euro-Asian Routes
37 pages
QTR (F (: India Ministry of
No ratings yet
QTR (F (: India Ministry of
2 pages
Seismic Passive Control of Cable-Stayed Bridges: Hosam-Eddin M. Ali
No ratings yet
Seismic Passive Control of Cable-Stayed Bridges: Hosam-Eddin M. Ali
15 pages
Ride Details Bill Details: Thanks For Travelling With Us, Ketan Gawande
No ratings yet
Ride Details Bill Details: Thanks For Travelling With Us, Ketan Gawande
3 pages
SR - No Chainages Description Observations As Per KML NH-161 JN To MH-TS Border
No ratings yet
SR - No Chainages Description Observations As Per KML NH-161 JN To MH-TS Border
1 page
4092 PDF
100% (1)
4092 PDF
2 pages
American Caving Accidents: 1998 Accident and Incident Reports On File
No ratings yet
American Caving Accidents: 1998 Accident and Incident Reports On File
2 pages
Vintage Airplane - Sep 2003
No ratings yet
Vintage Airplane - Sep 2003
36 pages
p4454 PDF
No ratings yet
p4454 PDF
17 pages
Fifa Fitnes Test
No ratings yet
Fifa Fitnes Test
22 pages
Zideman 2018
No ratings yet
Zideman 2018
5 pages
Basketball
No ratings yet
Basketball
6 pages
FB23 TDECU Stadium Pricing Map
No ratings yet
FB23 TDECU Stadium Pricing Map
1 page
02whole PDF
No ratings yet
02whole PDF
228 pages
Intramurals 2023-2024
No ratings yet
Intramurals 2023-2024
6 pages
Happy Go Ducky! 1
No ratings yet
Happy Go Ducky! 1
3 pages
Otterbein Football Workout
No ratings yet
Otterbein Football Workout
14 pages
40744-FoF-Revised 4
No ratings yet
40744-FoF-Revised 4
54 pages
185.woodenboat Issue
100% (2)
185.woodenboat Issue
157 pages
(1916) Counter Back On A Counter Boxing Without A Teacher - O.S. Westerman
88% (8)
(1916) Counter Back On A Counter Boxing Without A Teacher - O.S. Westerman
64 pages
Cricket Technology
100% (1)
Cricket Technology
18 pages
J40E0010E - B I-Con VVVF Control Electric Drawing (V2.0)
No ratings yet
J40E0010E - B I-Con VVVF Control Electric Drawing (V2.0)
29 pages
G-PHED004-BHM22-TEAM-SPORTS-2nd-Sem-2022-2023-https Dlsud - Edu20.org Student Take Quiz Assignment Start 39630870
No ratings yet
G-PHED004-BHM22-TEAM-SPORTS-2nd-Sem-2022-2023-https Dlsud - Edu20.org Student Take Quiz Assignment Start 39630870
3 pages
Calatayud Et Al 2016
No ratings yet
Calatayud Et Al 2016
9 pages
Rip - Xvid.ac3 Evo
No ratings yet
Rip - Xvid.ac3 Evo
122 pages
Floor Hockey Unit Plan N
No ratings yet
Floor Hockey Unit Plan N
22 pages
Análisis de Los Parámetros Espacio y Tiempo FUTSAL
100% (1)
Análisis de Los Parámetros Espacio y Tiempo FUTSAL
13 pages
Rachel Runs... On Holiday
No ratings yet
Rachel Runs... On Holiday
1 page
Michael Phelps - Most Successful Swimmer of All Times
No ratings yet
Michael Phelps - Most Successful Swimmer of All Times
2 pages
Buletin Baseball Final 3
No ratings yet
Buletin Baseball Final 3
178 pages
RTS5176E
No ratings yet
RTS5176E
1 page
Games and Tournaments Questions For CAT
No ratings yet
Games and Tournaments Questions For CAT
10 pages
Congressional Record 05-16-11
No ratings yet
Congressional Record 05-16-11
56 pages
Sachin Tendulkar
No ratings yet
Sachin Tendulkar
2 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Dream Team

Uploaded by

Dream Team

Uploaded by

import pandas as pd

overall = pd.merge(stats, stats2, on='Match')

from sklearn.model_selection import train_test_split

# Assuming 'model1_df' is the DataFrame containing the data

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=9999)

points_model = linear_model.LinearRegression().fit(X_train, y_train)

print('Training set accuracy:', points_model.score(X_train, y_train))

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=123)

models.at[i, 'next_runs_given'] = round(next_runs_given[0], 0)

# Display the models DataFrame with predictions

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.