0% found this document useful (0 votes)

3 views8 pages

CSC21000 Sort

The project involved implementing and analyzing the performance of a Bubble Sort algorithm in both C++ and MIPS assembly. The C++ implementation was tested with no optimization and full optimization, while the MIPS version was handwritten and executed in the MARS simulator. Results showed that C++ with full optimization significantly outperformed both MIPS and C++ without optimization, highlighting the importance of compiler optimizations and the limitations of Bubble Sort for large datasets.

Uploaded by

mohamed hiba

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views8 pages

CSC21000 Sort

Uploaded by

mohamed hiba

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 8

CSC21000

Mohamed Hiba
April 27, 2025

Bubble Sort Implementation and Performance Analysis (C++ and MIPS)

Objective:
The purpose of this project was to:

 Implement a Bubble Sort algorithm based on the textbook Computer Organization and
Design, 5th Edition, Section 2.13.
 Measure and compare runtime performance of:
o MIPS assembly implementation (handwritten, running in MARS).
o C++ implementation compiled with:
 No optimization (-O0)
 Full optimization (-O3)
 Generate an optimized assembly listing (.s file) from the C++ program.
 Analyze the performance impact of compiler optimization and discuss the potential for
manual optimization in MIPS.

Files Submitted:
File Name Description
sort_driver.cpp
C++17 program implementing bubble sort and swap, with timing via
std::chrono.
sort_O0 Executable compiled from sort_driver.cpp with no optimization (-O0).
sort_O3 Executable compiled from sort_driver.cpp with full optimization (-O3).
sort_O3.s Optimized C++ assembly listing generated with clang++ -S -O3.
bubble_sort.asm Handwritten MIPS program for bubble sort, runnable in MARS.

Methodology:
 C++ Implementation:
o sort_driver.cpp contains a direct implementation of textbook bubble sort and
swap.
o Timing was performed using std::chrono::high_resolution_clock.
o Arrays of size 10, 100, 500, and 1000 were initialized in descending order and
sorted.
o Compilation was done twice:
 Without optimization (-O0).
 With full optimization (-O3).
o Assembly code was generated using clang++ -S -O3.
 MIPS Implementation:
o bubble_sort.asm implemented the same algorithm manually in MIPS assembly.
o Timing was measured using syscall 30 (MARS simulator’s microsecond timer).
o Output printed the first 20 elements after sorting to verify correctness.
o Arrays of size 10, 100, 500, and 1000 were sorted.
o 10,000 elements were not tested on MIPS due to impractical simulation time (>20
minutes).

C++ Code (sort_driver.cpp):

// sort_driver.cpp
#include <iostream>
#include <vector>
#include <chrono>
#include <cstdlib>

void swap(int v[], int k)

{
int temp = v[k];
v[k] = v[k+1];
v[k+1] = temp;
}

void sort(int v[], int n)

{
for (int i = 0; i < n; ++i)
for (int j = i-1; j >= 0 && v[j] > v[j+1]; --j)
swap(v, j);
}

int main(int argc, char* argv[])

{
int N = (argc > 1) ? std::atoi(argv[1]) : 10000;
if (N < 10) N = 10;
if (N > 10000) N = 10000;

std::vector<int> v(N);
for (int i = 0; i < N; ++i) v[i] = N - i;

auto t0 = std::chrono::high_resolution_clock::now();
sort(v.data(), N);
auto t1 = std::chrono::high_resolution_clock::now();

std::cout << "first 10: ";

for (int i = 0; i < 10 && i < N; ++i) std::cout << v[i] << ' ';
std::cout << "\nμs: "
<< std::chrono::duration_cast<std::chrono::microseconds>(t1-
t0).count() << '\n';
}

MIPS Assembly Code (bubble_sort.asm)

 The swap and sort functions are based directly on textbook Figures 2-24 and 2-27.
 The array is manually initialized in descending order.
 Sorting time is measured using syscall 30.

#############################################################################
##
# bubble_sort_demo.s — Textbook bubble-sort + swap, ready for MARS
# Source: Computer Organization & Design, 5e (§2.13) – adapted for I/O + timing
# Author : Mohamed Hiba
#############################################################################
##

.data
.align 2
array: .space 40000 # 10 000 words × 4 bytes

prompt: .asciiz "Enter array size (10-10000): "

newline: .asciiz "\nFirst 20 sorted numbers:\n"
space: .asciiz " "
time_msg: .asciiz "\nElapsed time (microseconds): "
acc_newline: .asciiz "\n"

.text
.globl main

############################################################
# main — build descending array, call sort, time it, show results
############################################################
main:
# ---- read N -----------------------------------------------------------
li $v0, 4
la $a0, prompt
syscall

li $v0, 5 # read_int
syscall
move $s0, $v0 # s0 ← N

# clamp N to [10,10000] -----------------------------------------------

li $t0, 10
blt $s0, $t0, set10
li $t1, 10000
bgt $s0, $t1, set10000
j init_array
set10: li $s0, 10
j init_array
set10000: li $s0, 10000
# fall through

# ---- initialise array: array[i] = N-i --------------------------------

init_array:
la $s1, array # base ptr
move $t0, $zero #i=0
move $t2, $s0 # val = N
init_loop:
beq $t0, $s0, prep_sort
sw $t2, 0($s1)
addi $t0, $t0, 1
addi $t2, $t2, -1
addi $s1, $s1, 4
j init_loop

# ---- take start-time & call sort(v,n) -------------------------------

prep_sort:
li $v0, 30 # syscall 30: time in µs
syscall
move $t6, $a0 # t6 = start_time

la $a0, array # a0 = &v[0]

move $a1, $s0 # a1 = n
jal sort # ---- BUBBLE SORT ----

# ---- take end-time, compute elapsed -------------------------------

li $v0, 30
syscall
subu $t7, $a0, $t6 # t7 = end - start (µs)

# ---- print first 20 elements ---------------------------------------

li $v0, 4
la $a0, newline
syscall

li $t3, 0 # counter
la $t4, array # ptr
print_loop:
li $t5, 20
beq $t3, $t5, print_time
lw $a0, 0($t4)
li $v0, 1 # print_int
syscall
li $v0, 4
la $a0, space
syscall
addi $t3, $t3, 1
addi $t4, $t4, 4
j print_loop

# ---- show elapsed time ---------------------------------------------

print_time:
li $v0, 4
la $a0, time_msg
syscall

move $a0, $t7

li $v0, 1 # print_int
syscall

li $v0, 4
la $a0, acc_newline
syscall

# ---- exit ----------------------------------------------------------

li $v0, 10
syscall

############################################################
# swap(int v[], int k) — textbook leaf procedure (Fig 2-25)
############################################################
swap:
sll $t1, $a1, 2 # k*4
add $t1, $a0, $t1 # &v[k]
lw $t0, 0($t1) # temp = v[k]
lw $t2, 4($t1) # t2 = v[k+1]
sw $t2, 0($t1) # v[k] = t2
sw $t0, 4($t1) # v[k+1] = temp
jr $ra

############################################################
# sort(int v[], int n) — textbook bubble sort (Fig 2-27)
############################################################
sort:
addi $sp, $sp, -20
sw $ra, 16($sp)
sw $s3, 12($sp)
sw $s2, 8($sp)
sw $s1, 4($sp)
sw $s0, 0($sp)

move $s2, $a0 #v

move $s3, $a1 #n

move $s0, $zero #i=0

outer_test:
slt $t0, $s0, $s3 #i<n?
beq $t0, $zero, outer_exit

addi $s1, $s0, -1 # j = i-1

inner_test:
slti $t0, $s1, 0 #j<0?
bne $t0, $zero, inner_exit

sll $t1, $s1, 2 # j*4

add $t2, $s2, $t1 # &v[j]
lw $t3, 0($t2) # v[j]
lw $t4, 4($t2) # v[j+1]
slt $t0, $t4, $t3 # v[j+1] < v[j] ?
beq $t0, $zero, inner_exit

move $a0, $s2 # parm 1

move $a1, $s1 # parm 2
jal swap

addi $s1, $s1, -1 # j--

j inner_test
inner_exit:
addi $s0, $s0, 1 # i++
j outer_test
outer_exit:
lw $s0, 0($sp)
lw $s1, 4($sp)
lw $s2, 8($sp)
lw $s3, 12($sp)
lw $ra, 16($sp)
addi $sp, $sp, 20
jr $ra
6. Timing Results
Array Size (N) MIPS (baseline) (µs) C++ -O0 (µs) C++ -O3 (µs)
10 4 0 0
100 233 35 9
500 4462 573 305
1000 16606 4467 991
As the textbook mentions it is aligned with what we got:

Analysis:
 MIPS vs C++:
o MIPS shows classic O ( n2 ) growth, with runtime rapidly increasing with N.
o C++ -O0 performance was much better than MIPS, but still significant due to lack
of optimization.
o C++ -O3 optimization provided drastic improvements, showing the power of
modern compiler optimizations.
 10,000 element sort skipped on MIPS because it would require impractical simulation
time.
Observations and Takeaways
 Optimization Matters:
C++ -O3 provided up to 4× faster execution compared to -O0 without modifying source
code.
 Compiler Optimization:
In the C++ assembly (sort_O3.s), functions were inlined, loops were optimized, and
unnecessary instructions were eliminated.
 Manual MIPS Improvement (Future Work):
Although not required for this project, inlining the swap function or unrolling loops
would further improve the MIPS timing results.
 Scalability:
Bubble sort is not practical for large arrays; better sorting algorithms like quicksort would
perform significantly better.

COMP1521 22T1 - Week 03 Laboratory Sample Solutions
No ratings yet
COMP1521 22T1 - Week 03 Laboratory Sample Solutions
15 pages
Started On State Completed On Time Taken Grade 48.00 96 Feedback
No ratings yet
Started On State Completed On Time Taken Grade 48.00 96 Feedback
273 pages
Nabil Mohsen Alzeqri
No ratings yet
Nabil Mohsen Alzeqri
7 pages
ITITIU22184_NguyenTheVinh_Lab9
100% (2)
ITITIU22184_NguyenTheVinh_Lab9
14 pages
CS506 (2023-I) Lab Exercise 1
No ratings yet
CS506 (2023-I) Lab Exercise 1
3 pages
Algoritmos de Ordenamiento
No ratings yet
Algoritmos de Ordenamiento
5 pages
UCS055DAA
No ratings yet
UCS055DAA
4 pages
Q2.Nabil Mohsen Alzeqri
No ratings yet
Q2.Nabil Mohsen Alzeqri
7 pages
Lab 10
No ratings yet
Lab 10
41 pages
DS Lab File AKTU (2)
No ratings yet
DS Lab File AKTU (2)
61 pages
ADA-09
No ratings yet
ADA-09
26 pages
Ahsan Naseer Lab Report 5
No ratings yet
Ahsan Naseer Lab Report 5
17 pages
Vidya Bhavan College For Engineering Technology, Rautapur, Chaubeypur, Kanpur
No ratings yet
Vidya Bhavan College For Engineering Technology, Rautapur, Chaubeypur, Kanpur
22 pages
DAA Slip Ans
No ratings yet
DAA Slip Ans
101 pages
DAA Lab Manual
No ratings yet
DAA Lab Manual
26 pages
Albeena FRONT - PAGE
No ratings yet
Albeena FRONT - PAGE
19 pages
Ds Lab File
No ratings yet
Ds Lab File
73 pages
Muneeb Lab 05
No ratings yet
Muneeb Lab 05
19 pages
AoA Exp 1 To 10 by Gaurav Ameta
No ratings yet
AoA Exp 1 To 10 by Gaurav Ameta
37 pages
Index: S.No. Name of Practical Date
No ratings yet
Index: S.No. Name of Practical Date
16 pages
Assignment 01
No ratings yet
Assignment 01
16 pages
Daa Practical-1 Niraj Gajera - 23mca016: Data Size Name Best Avg Worst
No ratings yet
Daa Practical-1 Niraj Gajera - 23mca016: Data Size Name Best Avg Worst
10 pages
Osfile
No ratings yet
Osfile
9 pages
Daa Lab Manual
No ratings yet
Daa Lab Manual
55 pages
DAA Assignment
No ratings yet
DAA Assignment
20 pages
Untitled document
No ratings yet
Untitled document
11 pages
Daa2 1
No ratings yet
Daa2 1
8 pages
Ada Copy
No ratings yet
Ada Copy
4 pages
MPMC EXP 10 Code & Output Print
No ratings yet
MPMC EXP 10 Code & Output Print
6 pages
LAB04 Report
No ratings yet
LAB04 Report
9 pages
Copy of LAB EX NEW
No ratings yet
Copy of LAB EX NEW
34 pages
Ada Lab
No ratings yet
Ada Lab
109 pages
DAA Lab Manual New
No ratings yet
DAA Lab Manual New
60 pages
Algorithms Laboratory: Department of MCA
No ratings yet
Algorithms Laboratory: Department of MCA
32 pages
Rahul Kushwah 0901io201051 Design & Analysis of Algorithm Pratical File
0% (1)
Rahul Kushwah 0901io201051 Design & Analysis of Algorithm Pratical File
47 pages
Design And Analysis Of Algorithms Lab-1 (1)
No ratings yet
Design And Analysis Of Algorithms Lab-1 (1)
12 pages
cs3401 - Algorithms Lab Manual Final
100% (1)
cs3401 - Algorithms Lab Manual Final
35 pages
Practical Record File: Algorithms Analysis and Design (ETCS-351)
No ratings yet
Practical Record File: Algorithms Analysis and Design (ETCS-351)
23 pages
Daa Lab Manual
No ratings yet
Daa Lab Manual
21 pages
Assembly Language
No ratings yet
Assembly Language
2 pages
Advanced Data Structures
No ratings yet
Advanced Data Structures
597 pages
Srishti Practical File
No ratings yet
Srishti Practical File
48 pages
ADA Lab Programs
No ratings yet
ADA Lab Programs
22 pages
Ada Lab Programs
No ratings yet
Ada Lab Programs
39 pages
ADA lab prgms_Part-1
No ratings yet
ADA lab prgms_Part-1
7 pages
MehmetEmre Kantaş 001 LabWork Lab02
No ratings yet
MehmetEmre Kantaş 001 LabWork Lab02
7 pages
ADA hsjsnahakssjsbjssjsnsnkanssbhs
No ratings yet
ADA hsjsnahakssjsbjssjsnsnkanssbhs
58 pages
15315
No ratings yet
15315
41 pages
Satveer Da A
No ratings yet
Satveer Da A
30 pages
DAA Practical File
No ratings yet
DAA Practical File
37 pages
Dsa Ac
No ratings yet
Dsa Ac
23 pages
MIPS Arrays
No ratings yet
MIPS Arrays
8 pages
Adt Lab Manual 240429 095259
No ratings yet
Adt Lab Manual 240429 095259
53 pages
AOA-LAB-MANUALS (2)
No ratings yet
AOA-LAB-MANUALS (2)
27 pages
DAA FILE Raw
No ratings yet
DAA FILE Raw
30 pages
sel_merge_quick_sort (1)
No ratings yet
sel_merge_quick_sort (1)
12 pages
Ada Exp (1&2)
No ratings yet
Ada Exp (1&2)
7 pages
Assignment No1 DSA
No ratings yet
Assignment No1 DSA
24 pages
2301840012.pdf
No ratings yet
2301840012.pdf
40 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Profound Python Libraries
From Everand
Profound Python Libraries
Onder Teker
No ratings yet
Psd3a-Principles of Compiler Design
No ratings yet
Psd3a-Principles of Compiler Design
1 page
Holtek C Compiler V3 FAQ
No ratings yet
Holtek C Compiler V3 FAQ
25 pages
NIKKI
No ratings yet
NIKKI
14 pages
OpenACC Programming Guide 0 0
No ratings yet
OpenACC Programming Guide 0 0
73 pages
Title: Subtitle:: Optimization Techniques in High-Performance Computing Memory Pooling Vishnu Mallam
No ratings yet
Title: Subtitle:: Optimization Techniques in High-Performance Computing Memory Pooling Vishnu Mallam
9 pages
WP - On Schedule To Efficient Production
No ratings yet
WP - On Schedule To Efficient Production
11 pages
AWS Cloud Arch Design - Quiz
No ratings yet
AWS Cloud Arch Design - Quiz
3 pages
22 Informatica Interview Questions and Answers
No ratings yet
22 Informatica Interview Questions and Answers
5 pages
CS6601 Distributed System Syllabus
No ratings yet
CS6601 Distributed System Syllabus
10 pages
RNO Questions Answers
No ratings yet
RNO Questions Answers
15 pages
Assembly Language
No ratings yet
Assembly Language
3 pages
Compiler Design Visue: Q.1 What Is The Challenges of Compiler Design?
No ratings yet
Compiler Design Visue: Q.1 What Is The Challenges of Compiler Design?
16 pages
Ss 2 E-note Third Term Computer
No ratings yet
Ss 2 E-note Third Term Computer
74 pages
Verilator Manual
No ratings yet
Verilator Manual
82 pages
Vtune Profiler - Cookbook - 2023.0 766316 766317
No ratings yet
Vtune Profiler - Cookbook - 2023.0 766316 766317
323 pages
Informix DBAccess Utility
No ratings yet
Informix DBAccess Utility
208 pages
1200 Buildings Program BMS Seminar 1
No ratings yet
1200 Buildings Program BMS Seminar 1
37 pages
Digital Solutions EN
No ratings yet
Digital Solutions EN
20 pages
Managing Xerox's Multinational Development Center (All)
No ratings yet
Managing Xerox's Multinational Development Center (All)
21 pages
Ic Compiler II Ds
No ratings yet
Ic Compiler II Ds
7 pages
Hridey Goyal (DCA2203) System Software Assignment Answer of Sem 4th
No ratings yet
Hridey Goyal (DCA2203) System Software Assignment Answer of Sem 4th
12 pages
Integrating FPGA Development into Your HFT Roadmap
No ratings yet
Integrating FPGA Development into Your HFT Roadmap
5 pages
Lab Manual SPCC
No ratings yet
Lab Manual SPCC
62 pages
基于OpenCL的若干机器学习算法GPU实现及优化_王伟俨
No ratings yet
基于OpenCL的若干机器学习算法GPU实现及优化_王伟俨
63 pages
6.1. Introduction To Optimization: Meaning and Scope of Optimization
No ratings yet
6.1. Introduction To Optimization: Meaning and Scope of Optimization
8 pages
Conformal Verification Guide 8.1
No ratings yet
Conformal Verification Guide 8.1
98 pages
3G1x RF Optimization Guideline
No ratings yet
3G1x RF Optimization Guideline
85 pages
Action Per Minute - APM-1
No ratings yet
Action Per Minute - APM-1
6 pages
Production Manager 4 2020 en
No ratings yet
Production Manager 4 2020 en
20 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

CSC21000 Sort

Uploaded by

CSC21000 Sort

Uploaded by

CSC21000

Bubble Sort Implementation and Performance Analysis (C++ and MIPS)

C++ Code (sort_driver.cpp):

void swap(int v[], int k)

void sort(int v[], int n)

int main(int argc, char* argv[])

std::cout << "first 10: ";

MIPS Assembly Code (bubble_sort.asm)

prompt: .asciiz "Enter array size (10-10000): "

# clamp N to [10,10000] -----------------------------------------------

# ---- initialise array: array[i] = N-i --------------------------------

# ---- take start-time & call sort(v,n) -------------------------------

la $a0, array # a0 = &v[0]

# ---- take end-time, compute elapsed -------------------------------

# ---- print first 20 elements ---------------------------------------

# ---- show elapsed time ---------------------------------------------

move $a0, $t7

# ---- exit ----------------------------------------------------------

move $s2, $a0 #v

move $s0, $zero #i=0

addi $s1, $s0, -1 # j = i-1

sll $t1, $s1, 2 # j*4

move $a0, $s2 # parm 1

addi $s1, $s1, -1 # j--

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.