0% found this document useful (0 votes)

7 views2 pages

multiplication.ipynb - Colab

The document outlines the installation of the CUDA toolkit (version 11.2) and demonstrates a CUDA program for matrix multiplication. It includes commands to install CUDA, check the CUDA version, and compile a CUDA program that multiplies two square matrices. The program prompts the user for matrix sizes and elements, performs the multiplication, and displays the results.

Uploaded by

jshruti6896

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views2 pages

multiplication.ipynb - Colab

Uploaded by

jshruti6896

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

# Install CUDA toolkit (example: CUDA 11.

2)
!apt-get update
!apt-get install -y cuda-toolkit-11-2

Hit:1 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease

Hit:2 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64 InRelease
Hit:3 https://r2u.stat.illinois.edu/ubuntu jammy InRelease
Hit:4 http://archive.ubuntu.com/ubuntu jammy InRelease
Hit:5 http://security.ubuntu.com/ubuntu jammy-security InRelease
Hit:6 http://archive.ubuntu.com/ubuntu jammy-updates InRelease
Hit:7 http://archive.ubuntu.com/ubuntu jammy-backports InRelease
Hit:8 https://ppa.launchpadcontent.net/deadsnakes/ppa/ubuntu jammy InRelease
Hit:9 https://ppa.launchpadcontent.net/graphics-drivers/ppa/ubuntu jammy InRelease
Hit:10 https://ppa.launchpadcontent.net/ubuntugis/ppa/ubuntu jammy InRelease
Reading package lists... Done
W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' do
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
E: Unable to locate package cuda-toolkit-11-2

 

!nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver

Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jun__6_02:18:23_PDT_2024
Cuda compilation tools, release 12.5, V12.5.82
Build cuda_12.5.r12.5/compiler.34385749_0

!nvidia-smi

Mon Apr 28 03:21:41 2025

+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+

%%writefile mul.cu
#include <iostream>
#include <cuda_runtime.h>

global void matmul(int A, int B, int *C, int N) {

int Row = blockIdx.y * blockDim.y + threadIdx.y;
int Col = blockIdx.x * blockDim.x + threadIdx.x;
if (Row < N && Col < N) {
int Pvalue = 0;
for (int k = 0; k < N; k++) {
Pvalue += A[Row * N + k] * B[k * N + Col];
}
C[Row * N + Col] = Pvalue;
}
}

int main() {
int N;
std::cout << "Enter the size of the square matrices (N): ";
std::cin >> N;

int A = new int[N N];

int *B = new int[N * N];
int *C = new int[N * N];

std::cout << "Enter elements for matrix A:" << std::endl;

for (int i = 0; i < N * N; i++) {
std::cin >> A[i];
}
std::cout << "Enter elements for matrix B:" << std::endl;
for (int i = 0; i < N * N; i++) {
std::cin >> B[i];
}

int size = N * N * sizeof(int);

int dev_A, dev_B, *dev_C;

cudaMalloc(&dev_A, size);
cudaMalloc(&dev_B, size);
cudaMalloc(&dev_C, size);

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);

cudaMemcpy(dev_B, B, size, cudaMemcpyHostToDevice);

dim3 dimBlock(16, 16);

dim3 dimGrid((N + dimBlock.x - 1) / dimBlock.x, (N + dimBlock.y - 1) / dimBlock.y);

matmul<<<dimGrid, dimBlock>>>(dev_A, dev_B, dev_C, N);

cudaDeviceSynchronize(); // Important!

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);

std::cout << "Matrix Multiplication Results (first 10x10):" << std::endl;

for (int i = 0; i < 10 && i < N; i++) {
for (int j = 0; j < 10 && j < N; j++) {
std::cout << C[i * N + j] << " ";
}
std::cout << std::endl;
}

cudaFree(dev_A);
cudaFree(dev_B);
cudaFree(dev_C);
delete[] A;
delete[] B;
delete[] C;

return 0;
}

Writing mul.cu

!nvcc mul.cu -o mul -arch=sm_75

!./mul

Enter the size of the square matrices (N): 3

Enter elements for matrix A:
1 1 1
1 1 1
1 1 1
Enter elements for matrix B:
2
2 2 2
2 2 2
2 2 2
Matrix Multiplication Results (first 10x10):
6 6 6
6 6 6
6 6 6

Start coding or generate with AI.

addition.ipynb - Colab
No ratings yet
addition.ipynb - Colab
2 pages
Computación Distribuida y Paralela - Evidencia 3.Ipynb - Colab
No ratings yet
Computación Distribuida y Paralela - Evidencia 3.Ipynb - Colab
5 pages
Untitled0.ipynb - Colab
No ratings yet
Untitled0.ipynb - Colab
2 pages
Introduction To CUDA
No ratings yet
Introduction To CUDA
51 pages
Gpucoder Ug
No ratings yet
Gpucoder Ug
560 pages
Singapore p1
No ratings yet
Singapore p1
46 pages
CMakeLists
No ratings yet
CMakeLists
4 pages
Cuda Versions
No ratings yet
Cuda Versions
3 pages
Kopia Notatnika PolishCoinDetector - Ipynb - Colab
No ratings yet
Kopia Notatnika PolishCoinDetector - Ipynb - Colab
3 pages
Cuda Binary Utilities: Application Note
No ratings yet
Cuda Binary Utilities: Application Note
41 pages
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
Assignment 4 - HPC
No ratings yet
Assignment 4 - HPC
4 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
Using CUDA
No ratings yet
Using CUDA
57 pages
CUDA_Toolkit_Release_Notes
No ratings yet
CUDA_Toolkit_Release_Notes
50 pages
CUDA Binary Utilities
No ratings yet
CUDA Binary Utilities
36 pages
HPC Int2 Key
No ratings yet
HPC Int2 Key
10 pages
Cheat Sheet CUDA
No ratings yet
Cheat Sheet CUDA
2 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
CUDA Introduction
No ratings yet
CUDA Introduction
39 pages
English To Hindi Text Translation
No ratings yet
English To Hindi Text Translation
10 pages
Recipe For Running Simple CUDA Code On A GPU Based Rocks Cluster
No ratings yet
Recipe For Running Simple CUDA Code On A GPU Based Rocks Cluster
17 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
Multi Gpu Programming With Mpi
No ratings yet
Multi Gpu Programming With Mpi
93 pages
xenia.config
No ratings yet
xenia.config
14 pages
Xenia Canary Settings
No ratings yet
Xenia Canary Settings
12 pages
Part2 22
No ratings yet
Part2 22
97 pages
S62256 - Demystify CUDA Debugging and Performance with Powerful Developer Tools
No ratings yet
S62256 - Demystify CUDA Debugging and Performance with Powerful Developer Tools
44 pages
AcceleratingAIAdvancements Pre Print Doube Blind
No ratings yet
AcceleratingAIAdvancements Pre Print Doube Blind
9 pages
Gpu, Cuda and Pycuda
No ratings yet
Gpu, Cuda and Pycuda
11 pages
Nvidia - Ug - Matlab Gpu Coder
100% (1)
Nvidia - Ug - Matlab Gpu Coder
66 pages
Setup
No ratings yet
Setup
3 pages
Lecture17 12
No ratings yet
Lecture17 12
86 pages
Cuda Talk
100% (1)
Cuda Talk
82 pages
CUDA Tutorial
No ratings yet
CUDA Tutorial
50 pages
3-CUDA
No ratings yet
3-CUDA
5 pages
01 Cuda c Basics
No ratings yet
01 Cuda c Basics
32 pages
CUDA
No ratings yet
CUDA
33 pages
Cuda - New Features and Beyond Ampere Programming For Developers PDF
No ratings yet
Cuda - New Features and Beyond Ampere Programming For Developers PDF
78 pages
GPGPU Tutorial
No ratings yet
GPGPU Tutorial
155 pages
prm6
No ratings yet
prm6
1 page
CUDA Binary Utilities
No ratings yet
CUDA Binary Utilities
32 pages
CUDA_Binary_Utilities
No ratings yet
CUDA_Binary_Utilities
32 pages
PS4 - Ritesh Jaiswal - Ritesh - 054
No ratings yet
PS4 - Ritesh Jaiswal - Ritesh - 054
8 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
Nvflash
No ratings yet
Nvflash
8 pages
Gpu History and Cuda Programming Basics
No ratings yet
Gpu History and Cuda Programming Basics
44 pages
sysinfo-2024-09-28-19-59
No ratings yet
sysinfo-2024-09-28-19-59
12 pages
CUDA_Toolkit_Release_Notes
No ratings yet
CUDA_Toolkit_Release_Notes
26 pages
CUDA Compute Unified Device Architecture
No ratings yet
CUDA Compute Unified Device Architecture
26 pages
Command Line Arguments and Settings AUTOMATIC1111 - Stable-Diffusion-Webui Wiki GitHub
No ratings yet
Command Line Arguments and Settings AUTOMATIC1111 - Stable-Diffusion-Webui Wiki GitHub
1 page
HPC (Pra 04)
No ratings yet
HPC (Pra 04)
11 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
Owens
No ratings yet
Owens
67 pages
Opencl Setup
No ratings yet
Opencl Setup
24 pages
An Introduction To PyCUDA Using Prefix Sum Algorithm PDF
No ratings yet
An Introduction To PyCUDA Using Prefix Sum Algorithm PDF
6 pages
Creo Manufacturing 9.0 Black Book
From Everand
Creo Manufacturing 9.0 Black Book
Gaurav Verma
No ratings yet
CISCO PACKET TRACER LABS: Best practice of configuring or troubleshooting Network
From Everand
CISCO PACKET TRACER LABS: Best practice of configuring or troubleshooting Network
Mulayam Singh
No ratings yet
Building a Countdown Timer Web App with Vanilla HTML, CSS, and JavaScript.: A Practical Q&A Guide Using a Countdown Timer
From Everand
Building a Countdown Timer Web App with Vanilla HTML, CSS, and JavaScript.: A Practical Q&A Guide Using a Countdown Timer
Lumavalle Press
No ratings yet
27_ML_A1
No ratings yet
27_ML_A1
9 pages
BI_6_NEW
No ratings yet
BI_6_NEW
6 pages
HPC Report 1
No ratings yet
HPC Report 1
12 pages
ResNet
No ratings yet
ResNet
13 pages
GeForce RTX 3080 Family of Graphics Cards NVIDIA
No ratings yet
GeForce RTX 3080 Family of Graphics Cards NVIDIA
1 page
Gaming PCs
No ratings yet
Gaming PCs
2 pages
Gtoplmj
No ratings yet
Gtoplmj
2 pages
List Devices
No ratings yet
List Devices
53 pages
Graphics B x86 905
No ratings yet
Graphics B x86 905
3 pages
vasp_5.4.4.pl2-with-intel-2018
No ratings yet
vasp_5.4.4.pl2-with-intel-2018
3 pages
How To Disable Blacklist Nouveau Nvidia..
No ratings yet
How To Disable Blacklist Nouveau Nvidia..
7 pages
lastException
No ratings yet
lastException
16 pages
Recommended Psu Table
No ratings yet
Recommended Psu Table
2 pages
Gpu Hackintosh
No ratings yet
Gpu Hackintosh
1 page
GFX Device Perfs
No ratings yet
GFX Device Perfs
8 pages
Last Exception
No ratings yet
Last Exception
4 pages
App Start
No ratings yet
App Start
15 pages
Harga VGA Card
No ratings yet
Harga VGA Card
8 pages
List Devices
No ratings yet
List Devices
17 pages
Wyniki Testu Kart Graficznych Z Dnia 11 07 2014r
No ratings yet
Wyniki Testu Kart Graficznych Z Dnia 11 07 2014r
19 pages
Nvidia Sli-Certified Power Supply List: Geforce Gpu Configurations
No ratings yet
Nvidia Sli-Certified Power Supply List: Geforce Gpu Configurations
14 pages
Recommended Psu Table
No ratings yet
Recommended Psu Table
2 pages
Last UIException
No ratings yet
Last UIException
3 pages
Laptop Asus
No ratings yet
Laptop Asus
1 page
Tier Level
No ratings yet
Tier Level
1 page
Lastexception 63850246912
No ratings yet
Lastexception 63850246912
2 pages
Catalogo Tarjetas de Video Graficas 2023-1
No ratings yet
Catalogo Tarjetas de Video Graficas 2023-1
142 pages
lastUIException 63802229501
No ratings yet
lastUIException 63802229501
6 pages
Graphics Card Hierarchy Chart October 2010
No ratings yet
Graphics Card Hierarchy Chart October 2010
3 pages
Oegax Shop Invoice: London E17 9ly United Kingdom 43 Ravenswood RD
No ratings yet
Oegax Shop Invoice: London E17 9ly United Kingdom 43 Ravenswood RD
1 page
The History of NVIDIA
No ratings yet
The History of NVIDIA
2 pages
GeForce GTX 1650 D6 VENTUS XS OCV3
No ratings yet
GeForce GTX 1650 D6 VENTUS XS OCV3
1 page
List Devices
No ratings yet
List Devices
106 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

multiplication.ipynb - Colab

Uploaded by

multiplication.ipynb - Colab

Uploaded by

# Install CUDA toolkit (example: CUDA 11.

Hit:1 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease

nvcc: NVIDIA (R) Cuda compiler driver

Mon Apr 28 03:21:41 2025

global void matmul(int A, int B, int *C, int N) {

int A = new int[N N];

std::cout << "Enter elements for matrix A:" << std::endl;

int size = N * N * sizeof(int);

int dev_A, dev_B, *dev_C;

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);

dim3 dimBlock(16, 16);

matmul<<<dimGrid, dimBlock>>>(dev_A, dev_B, dev_C, N);

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);

std::cout << "Matrix Multiplication Results (first 10x10):" << std::endl;

!nvcc mul.cu -o mul -arch=sm_75

Enter the size of the square matrices (N): 3

Start coding or generate with AI.

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

multiplication.ipynb - Colab

Uploaded by

multiplication.ipynb - Colab

Uploaded by

# Install CUDA toolkit (example: CUDA 11.

Hit:1 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease

nvcc: NVIDIA (R) Cuda compiler driver

Mon Apr 28 03:21:41 2025

__global__ void matmul(int *A, int *B, int *C, int N) {

int *A = new int[N * N];

std::cout << "Enter elements for matrix A:" << std::endl;

int size = N * N * sizeof(int);

int *dev_A, *dev_B, *dev_C;

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);

dim3 dimBlock(16, 16);

matmul<<<dimGrid, dimBlock>>>(dev_A, dev_B, dev_C, N);

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);

std::cout << "Matrix Multiplication Results (first 10x10):" << std::endl;

!nvcc mul.cu -o mul -arch=sm_75

Enter the size of the square matrices (N): 3

Start coding or generate with AI.

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

global void matmul(int A, int B, int *C, int N) {

int A = new int[N N];

int dev_A, dev_B, *dev_C;