0% found this document useful (0 votes)
40 views31 pages

SFM A1.1

The document discusses various methods for analyzing business and economic data. It outlines descriptive statistics methods like measures of central tendency and dispersion to summarize data. Inferential statistics methods like hypothesis testing and regression are discussed to analyze relationships and make predictions. The document also covers primary and secondary data sources as well as data collection methods such as surveys, interviews, and observation. Cleaning techniques for missing values are presented, along with examples of descriptive statistics output analyzing properties data.
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as DOCX, PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
40 views31 pages

SFM A1.1

The document discusses various methods for analyzing business and economic data. It outlines descriptive statistics methods like measures of central tendency and dispersion to summarize data. Inferential statistics methods like hypothesis testing and regression are discussed to analyze relationships and make predictions. The document also covers primary and secondary data sources as well as data collection methods such as surveys, interviews, and observation. Cleaning techniques for missing values are presented, along with examples of descriptive statistics output analyzing properties data.
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as DOCX, PDF, TXT or read online on Scribd
You are on page 1/ 31

Part A: Evaluate business and economic data obtained from published sources.

1. Suggest method analysis


Descriptive statistics, inferential statistics, and modeling are the three methods
proposed. The graphical method is frequently used in descriptive statistics; qualitative
uses pie charts and bar charts, while quantitative uses histograms, scatter diagrams, and
dot plots. To obtain accurate results, researchers frequently combine the tabular method
with graphical methods. To analyze both qualitative and quantitative variables, methods
such as crosstabulation, frequency table, relative frequency, and percent frequency
distribution can be used. For the quantitative variable, the researcher can also use the
cumulative distribution, leaf, and stem. Numerical measurement is one method for
supplementing the findings of a research paper. For quantitative, some common
parameters such as Mode, Mean, Median, are the factors that help to know the central
tendency, or Range, IQR, Variance, Standard Deviation, Coefficient of Variance.
To get a more objective view of the results, knowing the whole population, researchers
can use methods for inferential statistics namely estimation and hypothesis testing.
Besides, correlation relationship and regression in modeling should also be
considered in the research paper.
2. The various sources of data in the fields of business and economics.
The two most important data sources in business and economics are primary and
secondary data. (Anderson et al., 2018).
 For primary data

Primary data is data not available, data collected from surveys, survey questions at the
time of use. Primary data is objective and reliable rather than secondary data. (Anderson
et al., 2018).
In statistical research, there are two types of primary data: observational data and
empirical data. In observational studies, researchers frequently collect data for analysis
via public surveys or opinion polls in order to observe the event in its most natural state.
Meanwhile, experimental data were collected under controlled conditions, providing the
researcher with additional information.

Advantages (Anderson et al., 2018). Disadvantages (Anderson et al., 2018)


Obtain objective and useful data It spend more time to plan and collect
data
-> they also struggle to ensure data
quality
New data can be added if required Highly unverified data due to self-
declared information
Researcher are unrestricted in their ability Requires amount of different resources
to adapt, design and evaluate the data
obtained
Personal information can be easily
obtained

 For secondary data.

Anderson et al. (2018) define secondary data is available data that has previously been
gathered from primary sources and made easily accessible for academics to use for their
own research is known as secondary data. It is a category of information that has
previously been gathered.
Advantages (Anderson et al., 2018) Disadvantages (Anderson et al., 2018)
Help researcher save time, money and The data could be false or poor quality
access to primary data simply
Provide background information that Dtaa that is no longer relevant to the
suitable recommendation for future current situation may be consider obsolete
research
Unsuitable for conducting research on a
specific topic

3. Data collection method in Business and Economics


As a result, each source requires a distinct method of data gathering (Anderson et al.,
2018).
 Secondary data collection procedures

Secondary data is gathered through publications including books, periodicals, journals,


and the internet. However, because of the simplicity and affordability of this approach,
the information gathered might be inaccurate and false.
 Primary data collection procedures

Organize interviews
This approach is quick and simple for researchers, requiring only a small group of
willing individuals and a few carefully written interview questions. To gather more
information, the interview question can be broadened. However, extraneous data from
the interview forces researchers to spend additional time refining the response.

Observation
Researchers will pay attention to people's behaviors and occurrences, adding their own
interpretations and ideas. Researchers do not need to pose questions while using this
technique. However, as it is a person's point of view, the facts could be affected by other
factors, making them seem more plausible in this context.
Survey and Questionnaire.
A questionnaire will be created by the researchers and given to participants in print or
online. This method enables scientists to test early theories because of the enormous
amount of data they have collected. The researcher must select clear, topic-related
questionnaire questions in order to get pertinent data.
Focus groups.
A group of persons with significant expertise and experience in the area of their study
will be the topic of the researchers' observations and interviews. The level of knowledge
of the responders, however, has a significant impact on the quality of the data produced
by this technique.Methods for analyzing data.

4. Methods for analyzing data.


 For Descriptive statistics.
According to Anderson et al. (2018), a statistics description is a brief description or
summary of a data set that can be found in annual reports of businesses, the artical, and
other publications. Tables, graphs, and charts are used to present data.
Two of the metrics in an information description are spread measurement and
concentrations trend measurement. The concentration trend measure takes into
account the significance of the data's central location rather than concentrating on a
single aspect of data dispersion like standard deviation, variance, deviation, lowest, and
maximum.
 For Inferential statistics.
Based on a random sample, inferential statistics attempts to forecast the future of a
population. Inferential statistics include parameter estimation and hypothesis testing.
Parameter estimation estimates the quantity using observational data, whereas
hypothesis testing evaluates the hypothesis using analytical results.
The contrast of two approaches (Byrne, 2007).
- Descriptive statistics only rely on data summaries, whereas inferential statistics stresses
analysis and conclusions.
- Inferential statistics use probabilities, whereas descriptive statistics use charts, graphs,
and numbers to represent data.
- Data is gathered, arranged, and presented in descriptive statistics such that it is simple
to interpret. Inferential statistics compare data and test hypotheses to generate
predictions.
- The data that is currently accessible is summarized by descriptive statistics, whereas
inferential analysis attempts to draw conclusions.
Applications in many context:
- Sometimes numbers are described using descriptive statistics. It aids managers in fact-
summarizing information for business strategy suggestions.
- Future projections benefit from the application of inferential statistics. Data analysis
allows managers to predict the future of the firm.
Part B:
1. Cleaning value
a. Missing value

Statistics
Is the property In what floors the
The type of property Funished or not property is?
N Valid 501 501 501
Missing 0 0 0

In what floors the property is?

Frequency Percent Valid Percent Cumulative Percent


Valid 1 146 29.1 29.1 29.1
10+ 5 1.0 1.0 30.1
2 97 19.4 19.4 49.5
3 24 4.8 4.8 54.3
4 13 2.6 2.6 56.9
5 11 2.2 2.2 59.1
7 9 1.8 1.8 60.9
8 1 .2 .2 61.1
Ground 178 35.5 35.5 96.6
Highest 13 2.6 2.6 99.2
Unknown 4 .8 .8 100.0

Total 501 100.0 100.0


Theo bảng thống kê, các dự liệu định tính: Loại tài sản, tài sản được trang bị nội thất và
tài sản ở tầng mấy không có giá trị bị mất, vẫn đủ 501 quan sát. Tuy nhiên, đối với giá
trị Tài sản ở tầng mấy có 4 giá trị hiển thị “Unknown”. Điều đó có nghĩa là, 4 giá trị này
có thể coi là missing value. Có thể giữ nguyên 4 giá trị này bởi nó không ảnh hưởng tới
kết quả của các mục phân tích sau đó.

Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
The price of property 501 33000 35000000 323888 4153433.298
8.38
Number of bedrooms 501 1 10 2.68 1.109
Number of bathrooms 501 1 8 2.16 1.085
The Area of the 499 35 900 147.11 102.862
property by m2
Valid N (listwise) 499

Đối với các dự liệu đinh lượng: số phòng tắm, số phòng ngủ, giá của tài sản và diện tích.
Theo như bảng thống kê số liệu, có thể thấy rằng mục Diện tích của tài sản có 2 dữ liệu
không hiển thị. Đó là missing value và sẽ được thay thế bằng SMEAN và ra cột diện tích
mới là Area_1

Result Variables
N of Case Number of Non-
Replaced Missing Values
Result Missing N of Valid Creating
Variable Values First Last Cases Function
1 Area_1 2 1 501 501 SMEAN(Are
a)

b. Oulier

Xét các giá trị outliers của 4 biến định lượng: giá của nhà, số lượng phòng ngủ, số lượng phòng tắm
và diện tích căn. Bởi vì mỗi biến có đơn vị tịnh khác nhau nên không thể vẽ chung 1 biểu đồ 4
boxplot. Từ đó , có 4 biểu đồ boxplot dưới đay, tương đương với 4 biến.
2. Recode:

Do số liệu ở mục “Tài sản ở tầng nào” lộn xộn nên sẽ được sắp xếp để trông gọn gàng
và thuận tiện cho việc phân tích thông kê. Theo đề bài, group 1 bao gồm ground, 1 và 2.
Các giá trị còn lại sẽ thuộc group 2. Và mục tổng hợp này được đặt tên là
“Level_group”. Do ở mục này không có giá trị bị thiếu nên sẽ có: 421 giá trị thuộc
nhóm 1 và 80 giá trị thuộc nhóm 2. Được thống kê ở bảng dưới đây:

Level by group 1,2


Cumulative
Frequency Percent Valid Percent Percent
Valid 1 421 84.0 84.0 84.0
2 80 16.0 16.0 100.0
Total 501 100.0 100.0

3. Investigate and comment each variable:


 For qualitative variables:

Group
Level by group 1,2
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 421 84.0 84.0 84.0
2 80 16.0 16.0 100.0
Total 501 100.0 100.0
The type of property
The type of property

Frequency Percent Valid Percent Cumulative Percent


Valid Chalet 386 77.0 77.0 77.0
Duplex 9 1.8 1.8 78.8
Penthouse 7 1.4 1.4 80.2
Standalone 37 7.4 7.4 87.6
Villa
Studio 14 2.8 2.8 90.4
Town House 28 5.6 5.6 96.0
Twin house 20 4.0 4.0 100.0

Total 501 100.0 100.0


Rõ ràng thấy từ bảng số liệu và biểu đổ, loại nhà Chalet được bán nhiều nhất. Cụ thể có
386/501 quan sát, chiếm 77%. Còn lại 23% là các loại nhhà còn lại: Cụ thể là
Standalone Villa chiếm 7.4%, Town Housse chiếm 5.6%, Twin housse chiếm 4%,
Studio chiếm 2.8%, Duplex chiếm 1.8% và ít nhất là Duplex chỉ với 9 quan sát, chiếm
1.4%.

The property funished

Is the property Funished or not

Cumulative
Frequency Percent Valid Percent Percent
Valid No 252 50.3 50.3 50.3
Yes 249 49.7 49.7 100.0
Total 501 100.0 100.0
Theo như bảng thống kê và biểu đồ tròn ở trên, dễ thầy số lượng nhà có trang bị nội thật
và không có nội thật là gần bằng nhau. Số lượng nhà có trang bị nội thất có 249 quan
sát, chiếm 49.7%. Và còn lại 50.3% với 252 quan sát là nhà thô, chưa có nội thất bên
trong.

 For quantitative variables:

Number of bedrooms
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 52 10.4 10.4 10.4
2 169 33.7 33.7 44.1
3 214 42.7 42.7 86.8
4 41 8.2 8.2 95.0
5 12 2.4 2.4 97.4
6 6 1.2 1.2 98.6
7 6 1.2 1.2 99.8
10 1 .2 .2 100.0
Total 501 100.0 100.0

Đối với số phòng ngủ trong mỗi căn nhà. Từ bảng thống kê và biểu đồ cột trên, ta thấy
rằng đa số các căn nhà có 3 phòng, có 214/501 quan sát, chiếm 42.7%. Có 169 quan sát
có 2 phòng ngủ, chiếm 33.7%.
Số căn nhà có 1 phòng ngủ là 52/501 quan sát và chiêms 10.4%. Còn lại các quan sát có
4,5,6,7 phòng ngủ có tỉ lệ dưới 10%. Chỉ có duy nhất 1 quan sát có 10 phòng ngủ, chiếm
0.2%.

Number of bathrooms
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 120 24.0 24.0 24.0
2 260 51.9 51.9 75.8
3 75 15.0 15.0 90.8
4 27 5.4 5.4 96.2
5 10 2.0 2.0 98.2
6 3 .6 .6 98.8
7 5 1.0 1.0 99.8
8 1 .2 .2 100.0
Total 501 100.0 100.0

Từ biểu đồ thanh và bảng tần suất ở trên cho thấy số lượng nhà có 2 phòng tắm chiếm tỉ
lệ cao nhất là 51.9%, tương đương với 260 quan sát. Con số này gấp hơn 2 lần số lượng
nhà có 1 phòng tắm và gấp hơn 3 lần số lượng nhà có 3 phòng tắm. Số lương nhà có
4,5,6,7 phòng tắm chiếm dưới 10%. Cũng chỉ có duy nhất 1 căn nhà tương đương với 1
quan sát có 8 phòng tắm, chiếm 0.2%. Có thể đây là quan sát có 10 phòng ngủ ở trên.
Descriptive Statistics
Std.
N Range Minimum Maximum Mean Deviation Variance Skewness
Std.
Statistic Statistic Statistic Statistic Statistic Statistic Statistic Statistic Error
The price of 501 34967000 33000 35000000 3238888.3 4153433.29 172510081 4.144 .109
property 8 8 60980.285
The Area of the 499 865 35 900 147.11 102.862 10580.539 3.583 .109
property by m2
Valid N 499
(listwise)

Price

Theo thống kê trong bảng trên, giá nhà trung bình trong tổng số là £3238888.38, với giá
cao nhất là £35000000 và thấp nhất là £33000. Do đó, phạm vi giá là 34967000. Khoảng
4153433.298 là độ lệch chuẩn. Dựa vào biểu đồ, giá trị độ lệch của 4.144 cho thấy dữ
liệu thực sự không được trải đều và bị lệch sang phải
Area

Từ những thông tin thu được trong bảng trên, có thể dễ dàng nhận thấy diện tích lớn
nhất của mội ngôi nhà là 900 m2, và số diện tích nhỏ nhất là 35 m 2, với giá trị trung bình
diện tích là khoảng 147.1. Độ lệch chuẩn của diện tích là 102.862m 2 và phạm vi kích
thước là 865m2. Biểu đồ trên cho thấy giá giá trị độ lệch của 3.583 chỉ ra rằng dữ liệu
không được phân phối bằng nhau và có độ lệch phải.
4. Explore the dependence of price on remaining variables:

 For Price and quantitative variables:

The relationship between price and Area


So sánh mối liên hệ vị trí giữa các dấu chấm trên biểu đồ phân tán này, thật đơn giản để
kết luận rằng mối quan hệ giữa giá và diện tích là tuyến tính, mạnh mẽ và tích cực. Do
đó, có thể nói rằng chúng là hai yếu tố phụ thuộc.

Correlations
The Area of the property by
The price of property m2
The price of Pearson Correlation 1 .711**
property Sig. (2-tailed) .000
N 501 499
The Area of the Pearson Correlation .711** 1
property by m2 Sig. (2-tailed) .000
N 499 499
**. Correlation is significant at the 0.01 level (2-tailed).
Theo bảng tương quan giữa giá và diện tích ở trên, nó cho thấy mối tương quan giữa
kích thước và giá là 0.711. Con số này cho thấy mối quan hệ rất tích cực. Thang đo này
nằm trong khoảng từ 0.7 đến 0.9 dẫn đến mối quan hệ rất tích cực giữa 2 biến. Tóm lại,
mối quan hệ của hai biến số gần gũi và có tác động lẫn nhau, cụ thể, nếu kích thước tăng
thì giá nhà sẽ tăng và ngược lại.
abc
The relationship betwenn Price and number of Bedrooms

The price of property Number of bedrooms


The price of Pearson Correlation 1 .612**
property Sig. (2-tailed) .000
N 501 501
Number of Pearson Correlation .612** 1
bedrooms Sig. (2-tailed) .000
N 501 501
Giá và số lượng phòng ngủ có hệ số tương quan là 0.612, điều này cho thấy 2 biến này
có tác động tích cực với nhau. Có một mối tương quan tích cực vừa phải giữa 2 biến này
vì thang đo này tương tự trong phạm vi từ 0.5 đến 0.7. Tóm lại, 2 biến này có tác mối
quan hệ, có tác động đến nhau nhưng ở mức độ vừa phải, không ảnh hưởng quá nhiều
đến nhau.
abc
Bathrooms

Correlations
The price of property Number of bathrooms
The price of Pearson Correlation 1 .643**
property Sig. (2-tailed) .000
N 501 501
Number of Pearson Correlation .643** 1
bathrooms Sig. (2-tailed) .000
N 501 501
**. Correlation is significant at the 0.01 level (2-tailed).

Theo biểu đồ Scatter và bảng hệ số tương quan, dễ thấy Giá cả và Số phòng có giá trị
tương quan là 0,643, điều này cho thấy có mối liên hệ tích cực giữa hai yếu tố này. Do
thực tế là thang đo này nằm trong khoảng từ 0,5 đến 0,7, nên có một mối liên hệ giữa hai
biến này có thể được mô tả là trung bình. Tóm lại, liên kết giữa hai biến có ảnh hưởng
lẫn nhau; tuy nhiên, tác động đó chỉ ở mức khiêm tốn và các biến không ảnh hưởng đến
nhau quá mức.
abc
 For Price and qualitative variables

Level_group
PHÂN TÍCH CÁI NÀYYYYYYYYYY

Level by group 1,2


Group 1 Group 2
Mean Standard Deviation Mean Standard Deviation
The price of 3281218 4139337 3016131 4246299
property

Correlations
Level by group 1,2 The price of property
Level by group 1,2 Pearson Correlation 1 -.023
Sig. (2-tailed) .601
N 501 501
The price of Pearson Correlation -.023 1
property Sig. (2-tailed) .601
N 501 501
5. The justification for choosing particular modes of communication.
Graphs, charts, and diagrams are often used as successful communication tools due to their
ability to communicate data in an orderly, comprehensible fashion. Each variable's
characteristics will determine the optimal mode of interaction for conveying information.
Frequency tables and bar charts will be utilized to analyze qualitative factors. Though
frequency tables are helpful for displaying how data is distributed within a category, they fall
short when a rapid examination is required. Because of this, comparisons will be made using
bar and pie charts. Cluster bar charts let analysts spot patterns more readily than pie charts,
which display information as a percentage of categories, column widths, or other scalar
measurements. The quantitative factors will be analyzed using tables and charts. Tables
and correlation tables show the most comprehensive presentation of data from several
variables, including metrics such as correlation, mean, variance, minimum, and maximum, all
in a single table. Scatter plots are employed when it is absolutely necessary to investigate the
connection between two quantitative variables, since the placement of the dots can reveal the
trend of both variables.
There are advantages and disadvantages to every kind of communication, so it's important to
evaluate them rationally.
6. Examine graphs and tables to convey information.
Data analysis requires weighing the benefits and drawbacks of various chart and table formats.
Because frequency tables make the distribution of data so clear, they are commonly employed
for the analysis of qualitative variables. However, it has a fundamental weakness in that it
relies on charts to assist express the significance of each option in the variable. Thus, pie charts
should only be used when there are five or less components, as they become too confusing
when there are too many options of the same size and proportion. This means that bar charts
can be used instead of pie charts when the number of distinct values in the variable is too large
to fit in the former. The analyst may quickly and readily compare data by looking at the relative
heights of the bars. Cross-tabulation and clustered bar graphs will be used to describe two
qualitative variables in order to offer an overview of the data patterns.
Quantitative data is better described using a table. It allows for the display of several
variables in tables and provides unambiguous numerical data for the variables, such as standard
deviation, average, and range, simplifying analysis. Additionally, the correlation between the
two numerical variables is assessed using both a scatter plot and a set of correlates tables.
Scatter plots are useful, but a correlation table is necessary for a more in-depth analysis. A
negative or positive, strong or weak, and consistent association between the variables may be
ascertained by examining the data provided by the correlation table.
Part C
1. T-Test
a. T-test compare to price of houses which are furnished and unfurnished

Group Statistics
Is the property
Funished or not N Mean Std. Deviation Std. Error Mean
The price of No 252 3043208.7659 3483084.39790 219413.69315
property
Yes 249 3436925.5703 4735328.91376 300089.27669

Independent Samples Test


Levene's Test
for Equality of
Variances t-test for Equality of Means
95% Confidence Interval
Sig. (2- Mean Std. Error of the Difference
F Sig. t df tailed) Difference Difference Lower Upper
The price of Equal 6.332 .012 -1.061 499 .289 -393716.80 371083.439 -1122795.3 335361.735
property variances
assumed
Equal -1.059 455. .290 -393716.80 371747.149 -1124269.3 336835.655
variances 433
not
assumed

Coding: No = 0; Yes = 1
In this part, we test the Equality of Variances:
Using hypothesis testing, specially H0: σ 21=σ 22 and H1: σ 21 ≠ σ 22
This part we assume α = 5% = 0.05
In the output table, with F= 6,332 we can see that P_value = 0,012
 Sig. (F) < alpha
0.012 < 0.05
 Reject H0  Choose H1: σ 21 ≠ σ 22
 Variances are unequal. Since H0 is rejected, there is no difference in the two variables. So
use the data from “Equal variances not assumed”

In this part, we test the Equality of Mean:


Similar in above, this part also uses hypothesis testing:

{ H 0: μ 1=μ 2
H 1 : μ1 ≠ μ2
with T Stat = -1,059

Therefore, the sig. (2-tailed) of this row is 0,290 higher than α = 0,05.
So, we have to do not reject H0 and to choose H0: μ1=μ2
 With the level of significance is 5%, the mean of population of the Price of houses which
are furnished and unfurnished is equal.
 There is no significant difference in the mean of these two values. This shows that the
furniture houses and unfunished houses does not affect the price. According to the statistics
table above, The unfurnished house is 3043208.7659 and the furnished house is
3436925.5703. There is no difference in price and almost no difference.
b. T-test compare to price of houses which are Level_group

Group Statistics

Level by group 1,2 N Mean Std. Deviation Std. Error Mean


The price of Group 1 421 3281217.5226 4139337.05213 201738.94393
property
Group 2 80 3016131.2375 4246299.02062 474750.66314

Independent Samples Test

Levene's Test for


Equality of
Variances t-test for Equality of Means
95% Confidence Interval
Sig. (2- Mean Std. Error of the Difference
F Sig. t df tailed) Difference Difference Lower Upper
The price of Equal variances 1.029 .311 .523 499 .601 265086.28 506939.149 - 1261084.5
property assumed 507 75 730911.961 3203
90

Equal variances .514 109.43 .608 265086.28 515836.014 - 1287410.8


not assumed 5 507 31 757238.321 9169
56

Coding: Group 1 = 1, Group 2 = 2


In this part, we test the Equality of Variances:

{
2 2
H 0: σ 1=σ 2
Using hypothesis testing:
H 1 :σ 21 ≠ σ 22

This part we assume α = 5% = 0.05


In the output table, with F= 1,029 we can see that P_value = 0,311
 Sig. (F) > alpha
0,311 > 0,05
 Do not reject H0  Choose H0: σ 21=σ 22
 Variances are equal. Since H0 is not rejected, so in the following steps we will use the
results in the line “Equal variances assumed”

In this part, we test the Equality of Mean:


Using hypothesis testing:

{ H 0is μ1=μ2
H 1=μ1 ≠ μ2
with T Stat = 0,523

Therefore, the sig. (2-tailed) of this row is 0,601 higher than α = 0,05.
 We have to not reject H0 and to choose H0: μ1=μ2

 At the 5% level of significance, the population mean of Housing Price and Level_group
 There is no significant difference in the mean of these two values. This shows which floor
housing has no effect on the price. According to the above statistics table, the average house
price in group 1 ( including Ground, 1 and 2) is 3281217.5226 and the average house price
in group 2 (including the remaining floors) is 3016131.2375. There is no difference in price
and almost no difference.
2. Regression model evaluation

Model Summary
Std. Error of the
Model R R Square Adjusted R Square Estimate
a
1 .732 .537 .532 2838573.09303

a. Predictors: (Constant), Funished-dum, Number of bedrooms, Level by group 1,2, The Area of the
property by m2, Number of bathrooms

Dum – Funished_dum
Level_group – Level by group 1,2
The percentage change in price is explained by all the independent variables.
The dependent variables R - squared and Modified R Square show that the independent
variables Bedrooms, Bathrooms, Area, Furnished_dum and Level by group 1,2 affect Price by
53.7% and 53.2%, respectively.
ANOVAa

Model Sum of Squares df Mean Square F Sig.


1 Regression 4598826692552820. 5 919765338510564.000 114.150 .000b
000

Residual 3972346121798761. 493 8057497204459.962


000

Total 8571172814351581. 498


000

a. Dependent Variable: The price of property


b. Predictors: (Constant), Funished-dum, Number of bedrooms, Level_group, The Area of the
property by m2, Number of bathrooms

In this section, we will apply hypothesis testing based on the ANOVA table; more precisely,
H0 will serve as the model of overall insignificance, while H1 will serve as the model of
overall significance.
With α = 0.05, according to the table, sig. = 0.000 is less than α, so Reject H0 and conclude
that the model has overall significance.

Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -1179434.902 522684.194 -2.256 .024

Number of bedrooms 108422.983 228350.041 .029 .475 .635


Number of bathrooms 919035.829 233099.681 .235 3.943 .000
The Area of the property 20734.937 2023.669 .514 10.246 .000
by m2
Level by group 1,2 -785740.877 351791.442 -.069 -2.234 .026
Funished-dum -2880.368 255323.061 .000 -.011 .991
a. Dependent Variable: The price of property

Number of bedrooms, Number of bathrooms, Area – Quantitative variables


Funished_dum, Level_group – Qualitative variables
For sample data:
Unstandardized Coefficients.
^
Price : The average value of Price
^
Price=β 0 + β 1∗Bedrooms+ β2∗Bathrooms+ β 3∗area+ β 4∗Funished dum+ β 5∗Level group

Biến định lượng:


β 1= 108422.983 vì vậy khi phòng ngủ tăng thêm 1 phòng, thì ^
Price sẽ tăng lên £108422.983 nếu

các biến còn lại được giữ nguyên.

β 2= 919035.829 có nghĩa là khi tăng thêm 1 phòng tắm, ^


Price sẽ tăng 919035.829 bảng Anh , giả
sử tất cả các biến khác vẫn không thay đổi.
β 3= 20734.937 có nghĩa là khi diện tích tăng thêm 1 mét vuông , ^
Price sẽ tăng 20734.937 bảng
Anh , nếu tất cả các biến khác vẫn không thay đổi.

Biến định tính:


Coding:
Funished_dum: No = 0; Yes = 1
Level_group: Group 1 = 1; Group 2 = 2
Giá nhà ở nhóm 1 ít nhỏ hơn 785740.877 so với nhà ở nhóm 2.
Giá nhà không có nội thất ita hơn 2880.368 do với nhà đã trang bị nội thất.

You might also like

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy