HƢỚNG DẪN THỰC HÀNH STATA 12

Similar documents
Bài tập 4 C# Mục tiêu:

Quản lý phạm vi (Scope) Chương II

Chương 7 KIẾN TRÚC MÁY TÍNH TIÊN TIẾN

Gv.HVK 1 KIỂU DỮ LIỆU CÓ CẤU TRÚC

Mô hình Mundell-Fleming

GIẢI PHÁP QUẢN LÝ DỊCH VỤ CNTT TỔNG QUAN

Mô hình Mundell-Fleming. IS-LM-CM Small Open Economy Capital Mobility

VẤN ĐỀ LÝ LUẬN VỀ MÔ HÌNH QUẢN TRỊ CHI PHÍ SẢN XUẤT CAPACITY CỦA CAM-I

Nguyên lý hệ điều hành. Các hệ thống lưu trữ. Cấu trúc đĩa. Lập lịch đĩa (1) Lập lịch đĩa (3) Lập lịch đĩa (2)

An toàn Bảo mật thông tin (Mật mã cổ điển) Giáo viên: Phạm Nguyên Khang

Hướng dẫn sử dụng NukeViet 2.0

Xây dựng lớp xử lý dữ liệu

LUẬN ÁN TIẾN SĨ KINH TẾ

ĐỀ CƢƠNG CHI TIẾT HỌC PHẦN NGÔN NGỮ LẬP TRÌNH 2 PROGRAMMING LANGUAGES II (LẬP TRÌNH DOTNET)

TÍNH TOÁN TẢI TRỌNG GIÓ TÁC DỤNG LÊN HỆ MẶT DỰNG KÍNH THEO TIÊU CHUẨN VIỆT NAM, HOA KỲ VÀ CHÂU ÂU

ETABS KIẾN THỨC SỬ DỤNG

ỨNG DỤNG MÁY TOÀN ĐẠC ĐIỆN TỬ LEICA VIVA TS15 VÀ PHẦN MỀM GOCA ĐỂ TỰ ĐỘNG QUAN TRẮC BIẾN DẠNG TƯỜNG VÂY NHÀ CAO TẦNG

GIẢI PHÁP TÍCH HỢP DỊCH VỤ NGHIỆP VỤ NGÂN HÀNG THEO MÔ HÌNH SOA

Công ước STCW 78/95/2012 sữa ñổi bổ xung và công tác ñào tạo tiếng Anh

KẾ TOÁN QUẢN TRỊ CHI PHÍ MÔI TRƯỜNG TRONG CÁC DOANH NGHIỆP CHẾ BIẾN DẦU KHÍ THUỘC TẬP ĐOÀN DẦU KHÍ QUỐC GIA VIỆT NAM

1.2 Vai trò của kế toán quản trị chi phí trong quản trị doanh nghiệp Mô hình lý thuyết cơ bản của kế toán quản trị chi phí 16

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN Lập trình Visual Basic.Net

ĐỒ ÁN TỐT NGHIỆP HỆ THỐNG THÔNG TIN

PHÂN TÍCH RỦI RO VỀ CHI PHÍ CỦA DỰ ÁN ĐẦU TƯ XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG RISK ANALYSIS FOR BUILDING PROJECT IN CONSTRUCTION PHASE

HỢP ĐỒNG MUA BÁN SALE CONTRACT Số / Ref. :../2017/

LÀM VIỆC THÔNG MINH TRONG NGÀNH BÁN LẺ

HỌC VIỆN TÀI CHÍNH GIẢI PHÁP TÁI CẤU TRÚC TÀI CHÍNH CÁC DOANH NGHIỆP TRONG NGÀNH THÉP

Chương 4. PHÂN TÍCH HỆ THỐNG: Mô hình luồng(dòng) dữ liệu

TƯ LIỆU VỤ KIỆN GIỮA PHILIPPINES VÀ TRUNG QUỐC VỀ TRANH CHẤP BIỂN ĐÔNG TẠI TOÀ TRỌNG TÀI

THÔNG BÁO TUYỂN SINH ĐÀO TẠO TRÌNH ĐỘ THẠC SĨ NĂM đợt 1 (Địa chỉ trang web: sinh/saudaihoc)

QUẢN TRỊ HỆ THỐNG GIAO THÔNG

BÀI TẬP MÔN HỌC KỸ THUẬT VI XỬ LÝ VÀ ỨNG DỤNG

Tổng quan về Áp dụng Tiếp cận Hệ sinh thái vào các khu đất ngập nước tại Việt Nam

NGHIÊN CỨU VỀ MẠNG NEURAL TÍCH CHẬP VÀ ỨNG DỤNG CHO BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE

HIỆU LỰC PHÒNG CHỐNG MỐI CỦA GỖ SAU XỬ LÝ LẮNG ĐỌNG SILICA, DUNG DỊCH HỖN HỢP SILICAT VÀ BORIC AXIT

Buhler Vietnam. 16-July Innovations for a better world.

TÀI LIỆU HƯỚNG DẪN SỬ DỤNG MIDAS/Civil

2898 max. ĐH Bách Khoa TP.HCM 1. Phổ của trái đất (288 o K) Phổ điện từ của ánh sáng. Định luật Wien. Dãy phổ phát ra từ mặt trời

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN

CÂY HẬU TỐ VÀ MỘT SỐ ỨNG DỤNG TRONG XỬ LÝ XÂU

Created date March, 2017 Dung Hoang, SEOtheTop.com

Một giải pháp tóm tắt văn bản tiếng Việt tự động

NGHIÊN CỨU PHÁT TRIỂN THƯƠNG MẠI ĐIỆN TỬ TRONG CÁC DOANH NGHIỆP DỊCH VỤ VÙNG KINH TẾ TRỌNG ĐIỂM MIỀN TRUNG

INDIVIDUAL CONSULTANT PROCUREMENT NOTICE. for individual consultants and individual consultants assigned by consulting firms/institutions

Phủ UV định hình theo màu in. Ép kim (vàng) Thúc nổi theo hình, ép kim (vàng)

TỔNG CỤC TIÊU CHUẨN ĐO LƯỜNG CHẤT LƯỢNG VIỆN NĂNG SUẤT VIỆT NAM

ĐÀ NẴNG. Thành phố đáng sống. nhất thế giới Điểm du lịch mới hấp dẫn nhất hành tinh

GIÁO TRÌNH SỬ DỤNG HỆ THỐNG

Lý do cần tuần hoàn nước?

ĐÁNH GIÁ HIỆU QUẢ XỬ LÝ BỀ MẶT BẰNG CÔNG NGHỆ PLASMA TRÊN MÀNG NHỰA PP, PE, PVC

Giới thiệu về Micro PLC "CP1L/1H"

243fully-finished units

DỰ BÁO NGUY CƠ VÀ CƯỜNG ĐỘ PHÁT TRIỂN TRƯỢT LỞ KHU VỰC THỊ XÃ BẮC KẠN

PHƯƠNG PHÁP NGHIÊN CỨU. Lý thuyết & thực tiễn. Tháng 8/2016. Kantar Media

LẬP TRÌNH DI ĐỘNG. Bài 6: Các Điều Khiển Cơ Bản

ỨNG DỤNG MẠNG NORON NHÂN TẠO SOM CHO BÀI TOÁN NHẬN DẠNG KÍ TỰ

HAGAR JOB DESCRIPTION HOUSE MOTHER (PART TIME)

KIEÁN TRUÙC MAÙY TÍNH TIEÂN TIEÁN

Cao ốc hoàn thiện mà khách không đến

NƠI CUỘC SỐNG. hăng hoa. Khu tổ hợp du lịch Sonasea Villas & Resort. Dương Tơ, Phú Quốc, Việt Nam.

SO SÁNH ẢNH HƯỞNG CỦA DẦU ĐẬU NÀNH VÀ MỠ CÁ ĐẾN TỈ LỆ TIÊU HÓA VÀ TĂNG TRỌNG CỦA BÒ VỖ BÉO

BAG CAO TAI CHINH GILKA NIEN DO. 6 THANG OAU CUA NAM TA! CHINH KfiT THUC NGAY 31 THANG 12 NAM 2015

KHOA KINH TẾ BỘ MÔN THẨM ĐỊNH GIÁ LUẬT PHÁP BẤT ĐỘNG SẢN Ở ÚC

An Appraisal Study of Social Attitudes in News Reports towards President Obama s Visit to Vietnam

BÁO CÁO THƯỜNG NIÊN NĂM 2017

Landscape Heritage in Vietnam. Di sản cảnh quan Việt Nam

TỔNG QUAN / OVERVIEW. Poolhouse Restaurant

Điều khiển chống rung cho cầu trục ba chiều bằng phương pháp Hybrid Shape

UNIT CORP HỒ SƠ GIỚI THIỆU CÔNG TY UNIT CORP PHIÊN BẢN: 1.0. Công Viên Tri Thức Việt Nhật, Trần Não, Quận 2, TPHCM

MỤC LỤC MỞ ĐẦU... 7 CHƢƠNG 1 : MẠNG NƠRON VÀ QUÁ TRÌNH HỌC CỦA MẠNG NƠRON Giới thiệu về mạng nơron và quá trình học của mạng nơron...

Viện Hàn lâm Khoa học và

PRIME LOCATION THE EAST SEA

Dear friends, 2- Friday Nov 11, 2016: Gala diner at Khu du lịch Văn Thánh with live band, singers, dancing, soft drinks.

Lập trình Pascal. Biên tập bởi: Thu Nguyen

Once in a while, it s nice to be reminded that you re important and appreciated.

LE MERIEN DA NANG RESORT & SPA PROJECT

Vũ Tài Lục. Thủ đoạn chính trị. Chào mừng các bạn đón đọc đầu sách từ dự án sách cho thiết bị di động. Nguồn:

Company Portfolio Wonder Technique Corporation

GIÚP ÐỌC LỜI CHÚA NOVA VULGATA VÀ CÁC BẢN CỔ KINH THÁNH

The 100 Best Business Books of All Time 100 CUỐN SÁCH QUẢN TRỊ KINH DOANH HAY NHẤT MỌI THỜI ĐẠI. The 100 Best Business Books of All Time

Bài tập ngôn ngữ lập trình C++

The Vietnamese Land Law 2003 and significant renovations on land policy towards the Country s industrialization

BAO CAO TAI CHINH CHO NAM TAI CHINH KET THUC NGAY 31 THANG 12 NAM 2017 CONG TY CO PHAN CONG TRINH DO THI VAN NINH

VIETNAM JAPAN ARCHITECTURE FORUM 2017 Ho Chi Minh City 2017 Feb. 20 Feb. 21 The 3 rd Asian Urban Architecture Forum REPORT

CONG TY CO PHAN CONG TRiNH DO THI VAN

Vietnam Land Administration Views from Poverty Alleviation and Small & Medium Enterprise Development. Vo, DANG HUNG and Trung TRAN NHU, Vietnam

Hội viên. Quà tặng. Thẻ. Phiếu. MIỄN PHÍ GỬI XE 2 GIỜ với hóa đơn từ VND ĐẶC BIỆT

LEADVISORS TOWER. Render Images Area Schedule Specifications Floor Plan PHAM VAN DONG, BAC TU LIEM, HANOI. Exclusive Leasing Agent

ITAXA Building, M Level, 126 Nguyen Thi Minh Khai St., District 3, HO CHI MINH CITY, VIET NAM

fb.com/nanoco.com.vn

DRAGON HILL CITY HA LONG INTRODUCTION DRAGON HILL CITY INTRODUCTION FACILITIES SITE MAP UNIT FLOOR PLANS ABOUT N.H.O

CONG TY CO PHAN VAN TAI VA DJCH Vy LIEN NINH. BAO CAO TAI CHINH DA BlfQC KIEM TOAN Cho n5m tai chinh ket thuc ngay 31 thang 12 nam 2017

Accessibility to Land Administration by Grassroots Stakeholders in Vietnam: Case study of Vinh Long Province

Sinks & Taps

C ~ MVC LVC Trang. Bao cao cua HQi d6ng quan tr! 1-3. Bao cao ki6m toan dqc IfP. Bao cao tai chinh di du'q'cki6m toan. Bang can doi kll toan

COMPANYăPROFILE VIET HAN PRODUCTION TRADING & CONSTRUCTION CO., LTD

R3 - Test 11. Question 1

Vietnam Airlines TONG CONG TY HANG KHONG VIET NAM-CTCP. BAO CAO TAI CHiNH HOOP NHAT QuST 1 nam 2017

BEACH ACTIVITIES PRICE LIST

CONG TY CO PHAN KAM DINH XAY DIING IDICO VINACONTROL. RAO CA() TAI CHiNH DA DU.QC KIEM TOAN

Transcription:

TRƢỜNG ĐẠI HỌC KINH TẾ TPHCM HƢỚNG DẪN THỰC HÀNH STATA 12 PHẦN CƠ BẢN TRẦN THỊ TUẤN ANH 14

TRẦN THỊ TUẤN ANH - UEH 2

LỜI MỞ ĐẦU Stata là phần mềm xử lý số liệu rất mạnh, được sử dụng phổ biến trong đào tạo và nghiên cứu về Kinh tế lượng. Tài liệu Hướng dẫn thực hành Stata 12 được soạn ra để phục vụ cho sinh viên, học viên cao học, nghiên cứu sinh, các nhà nghiên cứu muốn tìm hiểu thực hành các kiến thức Kinh tế lượng trên phần mềm Stata Số liệu thực hành được sử dụng trong tài liệu này có thể được tìm thấy tại trang web http://sites.google.com/site/anhttt - mục số liệu thực hành. Đây là tài liệu được soạn thảo lần đầu tiên nên còn rất nhiều thiếu sót. Mọi góp ý giúp cải thiện tài liệu xin gửi về địa chỉ mail anhttt@gmail.com. Tác giả xin trân trọng mọi ý kiến đóng góp. Trần Thị Tuấn Anh TRẦN THỊ TUẤN ANH - UEH 3

TRẦN THỊ TUẤN ANH - UEH 4

MỤC LỤC CHƢƠNG 1 : GIỚI THIỆU PHẦN MỀM STATA 12... 8 1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12... 8 1.1.1. Khởi động phần mềm Stata... 8 1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA... 9 1.2.1. Nhập liệu trực tiếp từ bàn phím... 9 1.2.4. Mở một tập tin số liệu có sẵn của Stata... 13 1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA... 14 1.3.1. Lƣu dữ liệu... 14 1.3.2. Lƣu kết quả xử lý số liệu... 14 a. Sao chép và cắt dán... 14 b. Sử dụng file log... 15 1.4. TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA... 17 1.4.1. Xóa biến trong Stata... 17 1.4.2. Đổi tên biến trong Stata... 18 1.4.3. Tạo biến mới từ những biến đã có... 19 1.5. THOÁT KHỎI PHẦN MỀM STATA... 21 CHƢƠNG 2 : HỒI QUY TUYẾN TÍNH VỚI STATA... 22 2.1. MÔ TẢ SỐ LIỆU... 22 2.1.1. Mô tả tập tin số liệu... 22 2.1.2. Thực hiện mô tả tóm tắt số liệu... 22 2.1.3. Vẽ đồ thị phân tán... 24 2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS... 25 2.2.1. Ƣớc lƣợng mô hình hồi quy tuyến tính bằng phƣơng pháp OLS... 26 2.2.2. Hệ số xác định và kiểm định hệ số xác định... 27 2.2.3. Khoảng tin cậy của hệ số hồi quy... 28 TRẦN THỊ TUẤN ANH - UEH 5

2.2.4. Kiểm định giả thuyết về hệ số hồi quy... 29 a. Kiểm định giả thuyết hai phía... 29 b. Kiểm định giả thuyết phía phải... 30 c. Kiểm định giả thuyết phía trái... 31 d. Kiểm định giả thuyết đồng thời liên quan đến tổ hợp tuyến tính các hệ số hồi quy... 31 2.3. PHẦN DƢ CỦA MÔ HÌNH HỒI QUY... 32 2.3.1. Vẽ biểu đồ histogram của phần dƣ... 33 2.3.2. Kiểm định tính chuẩn của phần dƣ... 33 2.4. XUẤT NHIỀU KẾT QUẢ HỒI QUY DƢỚI DẠNG BẢNG... 34 CHƢƠNG 3 : MỞ RỘNG HỒI QUY TUYẾN TÍNH... 36 3.1. HỒI QUY TUYẾN TÍNH QUA GỐC TỌA ĐỘ... 36 3.2. DẠNG HÀM LOG LOG; DẠNG HÀM LOG LIN; DẠNG HÀM LIN LOG... 36 3.2.1. Dạng hàm log log... 36 3.2.2. Dạng hàm log lin... 37 3.2.3. Dạng hàm lin log... 38 3.3. DẠNG HÀM BẬC HAI (QUADRATIC MODEL)... 39 CHƢƠNG 4 : HỒI QUY VỚI BIẾN GIẢ... 40 4.1. GIỚI THIỆU BIẾN GIẢ... 40 4.2. HỒI QUY VỚI BIẾN GIẢ... 40 4.3. HỒI QUY VỚI BIẾN TƢƠNG TÁC... 41 4.4. Tạo biến giả từ biến định tính... 43 4.4.1. Tạo bằng lệnh tabulate... 43 4.4.2. Dùng biến factor... 44 4.5. TƢƠNG TÁC GIỮA 2 BIẾN ĐỊNH GIẢ - PHƢƠNG PHÁP DIFFERENCE IN DIFFERENCE... 45 4.6. ƢỚC LƢỢNG HÀM HỒI QUY THEO TỪNG NHÓM... 45 TRẦN THỊ TUẤN ANH - UEH 6

CHƢƠNG 5 : ĐA CỘNG TUYẾN... 48 5.1. PHÁT HIỆN ĐA CỘNG TUYẾN... 48 5.1.1. Hệ số tƣơng quan... 48 5.1.2. Nhân tử phóng đại phƣơng sai (vif)... 49 5.2 PHÁT HIỆN ĐỔI DẤU DO ĐA CỘNG TUYẾN... 49 CHƢƠNG 6 : PHƢƠNG SAI THAY ĐỔI... 51 6.1. PHÁT HIỆN PHƢƠNG SAI THAY ĐỔI... 52 6.1.1. Đồ thị phần dƣ... 52 6.1.2. Kiểm định Breusch Pagan... 52 6.1.3. Kiểm định White... 53 6.2. XỬ LÝ PHƢƠNG SAI THAY ĐỔI... 55 6.2.1. Ƣớc lƣợng vững của ma trận hiệp phƣơng sai... 55 6.2.2. Phƣơng pháp bình phƣơng nhỏ nhất tổng quát (GLS)... 56 CHƢƠNG 7 : TỰ TƢƠNG QUAN... 58 7.1. KIỂM ĐỊNH TỰ TƢƠNG QUAN... 59 7.1.1. Đồ thị phần dƣ... 59 7.1.2. Biểu đồ tự tƣơng quan ( ACF - Autocorrelation Function)... 60 7.1.3. Kiểm định Durbin Watson... 60 7.1.4. Kiểm định Breusch Godfrey... 61 7.2. XỬ LÝ TỰ TƢƠNG QUAN... 62 7.2.1. Ma trận ƣớc lƣợng hiệp phƣơng sai Newey - West... 62 7.2.2. Khắc phục tự tƣơng quan bằng GLS thủ tục Prais - Winsten... 63 TÀI LIỆU THAM KHẢO... 65 TRẦN THỊ TUẤN ANH - UEH 7

CHƯƠNG 1 : GIỚI THIỆU PHẦN MỀM STATA 12 1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12 1.1.1. Khởi động phần mềm Stata Tên gọi Stata đƣợc viết tắt từ Statistics và data. Việc khởi động Stata có thể đƣợc thực hiện bằng nhiều cách: Cách 1 : Khởi động bằng cách nhấp chuột kép (double - click) vào biểu tƣợng phần mềm trên màn hình chính (Desktop) của hệ điều hành. - Cách 2 : Khởi động bằng cách nhấp chuột kép vài những tập tin số liệu có phần mở rộng là dta. Đây là những tập tin số liệu củ Stata. Khi nhấp chuột kép vào những tập tin này, hệ điều hành sẽ tự động khởi động phần mềm Stata để đọc tập tin loại này. Lưu ý : trong một vài trƣờng hợp, hệ điều hành chƣa nhận dạng đƣợc tập tin *.dta là tập tin của Stata, để mở tập tin cần nhấp chuột phải trên tập tin.dta cần mở, chọn Open with và chọn Choose default program. Sau đó nhất nút lệnh Browse trên cửa sổ hiện ra và chỉ đƣờng dẫn đến nơi cài đặt Stata hoặc chỉ đƣờng dẫn đến màn hình chính có biểu tƣợng Stata. Giao diện của phần mềm Stata 12 sau khi khởi động sẽ gồm có 4 cửa sổ chính Command Results Review Variables : cửa sổ lệnh, là nơi để nhập các câu lệnh cần thực hiện : cửa sổ kết quả, để hiển thị kết quả thực thi các câu lệnh : cửa sổ xem lại, nơi liệt kê tất cả các câu lệnh đã sử dụng từ khi Stata đƣợc khởi động : cửa sổ tên biến, liệt kê danh sách các biến đang đƣợc sử dụng TRẦN THỊ TUẤN ANH - UEH 8

Phía trên bên trái của màn hình Stata là hệ thống thực đơn chính (main menus) Phía dƣới hệ thống thực đơn chính là thanh công cụ hiển thị các nút lệnh ứng với các chức năng thƣờng đƣợc sử dụng của Stata 1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA 1.2.1. Nhập liệu trực tiếp từ bàn phím Nếu muốn nhập liệu trực tiếp vào Stata, ngƣời dùng cần sử dụng màn hình nhập liệu (Data editor window) của Stata bằng cách nhấp chuột vào nút lệnh edit trên thanh công cụ Hoặc dùng lệnh TRẦN THỊ TUẤN ANH - UEH 9

Khi đó, cửa sổ nhập liệu sẽ hiển thị. 1.2.2. Sao chép và cắt dán từ Excel Thay vì gõ số liệu trực tiếp, ta có thể sao chép số liệu từ Excel và dán vào Stata. Đầu tiên, mở tập tin Excel có chứa dữ liệu, đánh dấu khối những dữ liệu cần sao chép (kể cả dòng tên biến trên cùng); sau đó nhấn Ctrl+C để thực hiện sao chép. Sau đó, chuyển qua cửa sổ nhập liệu của Stata, nhấn Ctrl + V để dán số liệu. Vì dòng đầu tiên là tên biến nên chú ý chọn mục Treat first row as variable name trong hộp hội thoại hiện ra sau khi dán dữ liệu. Số liệu sau khi dán sẽ có dạng sau: TRẦN THỊ TUẤN ANH - UEH 10

Dữ liệu sau khi chuyển sang Stata nhƣ trên đã sẵn sàng cho việc xử lý. 1.2.3. Nhúng một file số liệu từ Excel Để việc nhập liệu đƣợc thuận tiện, Stata còn cho phép nhúng (import) một tập tin dữ liệu có sẵn ở những định dạng khác (nhƣ txt, csv, xls, SAS ). Tuy nhiên, định dạng thƣờng gặp nhất là xls hoặc xlsx của Excel. Chức năng này đƣợc thực hiện bằng cách chọn mục import trong thực đơn File của hệ thống thực đơn chính hoặc dùng lệnh import của Stata. Lệnh import đƣợc nhập theo ví dụ sau. Hoặc dùng hệ thống thực đơn của Stata : File/Import/Excel spreadsheet TRẦN THỊ TUẤN ANH - UEH 11

Sau khi chọn chức năng từ hệ thống thực đơn, cửa sổ nhúng tập tin sẽ hiện ra. Ta phải chỉ đƣờng dẫn đến tập tin, chọn sheet có số liệu, chọn vùng có số liệu trên sheet đã chọn. Nếu dòng đầu tiên của tập tin là tên biến thì chọn vào ô import first row as variable name và sau đó nhấn OK Các biến sau khi đƣợc nhập trực tiếp hoặc nhúng vào Stata sẽ hiển thị ra trong cửa sổ TRẦN THỊ TUẤN ANH - UEH 12

biến số bên phải của màn hình Stata 1.2.4. Mở một tập tin số liệu có sẵn của Stata Nếu đã có sẵn tập tin số liệu của Stata trên máy tính, có thể mở trực tiếp tập tin này bằng lệnh use Hoặc chọn từ hệ thống thực đơn File/Open và chỉ rõ đƣờng dẫn đến tập tin cần mở trong cửa sổ hiện ra Hoặc sử dụng nút lệnh Open trên thanh công cụ TRẦN THỊ TUẤN ANH - UEH 13

1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA 1.3.1. Lƣu dữ liệu Muốn lƣu dữ liệu đã nhập vào Stata, sử dụng lệnh save Hoặc dùng thực đơn File/Save hoặc File/Save as Hoặc sử dụng nút lệnh save từ thanh công cụ 1.3.2. Lƣu kết quả xử lý số liệu Sau khi xử lý số liệu, kết quả xử lý số liệu đƣợc lƣu bằng nhiều cách. a. Sao chép và cắt dán Nếu muốn sao chép và xuất kết quả xử lý số liệu ra Word hoặc Excel, có thể dùng các chức năng copy đƣợc Stata hỗ trợ. Trƣớc hết, chọn mảng kết quả cần sao chép trên cửa số Result, nhấp chuột phải và chọn một trong số các chức năng copy trên thực đơn hiện ra. TRẦN THỊ TUẤN ANH - UEH 14

Mỗi chức năng copy của Stata có một định dạng khác nhau. Do đó, nên lựa chọn chức năng phù hợp nhất với yêu cầu. Tuy nhiên, lựa chọn thông dụng nhất là copy table để sao chép số liệu vì định dạng này giữ nguyên hàng cột của kết quả cần sao chép, đồng thời cho phép kẻ khung hoặc trang trí lại cách trình bày. Lựa chọn copy as picture sẽ xuất kết quả dạng ảnh nên không thể trang trí lại theo yêu cầu. b. Sử dụng file log Những kết quả thực hiện lệnh đƣợc hiển thị ra trên cửa sổ kết quả results không thể lƣu đƣợc bằng lệnh save. Nếu muốn lƣu những kết quả này, cần sử dụng tập tin log. Tập tin log của Stata có hai định dạng : dạng tập tin.txt và dạng tập tim.smcl. Tuy nhiên, dạng.smcl thƣờng đƣợc sử dụng vì nó giữ nguyên định dạng kết quả mà Stata xuất ra. Để tạo một tập tin.smcl, dùng lệnh. Phía sau từ khóa using là đƣờng dẫn và tên của tập tin log sẽ đƣợc tạo Hoặc có thể dùng hệ thống thực đơn File/Log/Begin TRẦN THỊ TUẤN ANH - UEH 15

Sau các thao tác trên, ở cửa sổ kết quả sẽ hiển thị các thông tin cho biết tập tin log đã đƣợc tạo Và thanh trạng thái ở cuối cửa sổ kết quả sẽ có dòng chữ Kể từ lúc này trở đi, các câu lệnh cũng nhƣ kết quả thực hiện câu lệnh đó sẽ đƣợc Stata lƣu lại trong tập tin log. Sau khi kết thúc các thao tác, nếu muốn dừng lƣu và đóng tập tin log thì dùng lệnh Hoặc chọn từ thực đơn chính File /Log/ Close TRẦN THỊ TUẤN ANH - UEH 16

Lưu ý : những kết quả thực hiện chỉ đƣợc lƣu khi tập tin log đã đƣợc tạo, có dấu hiệu log on ở cuối cửa sổ lệnh. Những kết quả thực hiện lệnh trƣớc khi tạo tập tin log hoặc sau khi tập tin log đã đƣợc đóng đều không đƣợc lƣu lại. 1.4. TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA 1.4.1. Xóa biến trong Stata Để xóa bớt một hay nhiều biến trong số các biến đã tạo có thể dùng lệnh drop. Phía sau tên lệnh là danh sách các biến cần xóa, mỗi tên biến cách nhau một khoảng trắng. Nếu muốn xóa tất cả các biến trong tập tin số liệu, dùng lệnh Nếu muốn xóa những biến có cùng những ký tự đầu trong tên giống nhau, ví vụ nhƣ var01, var02, var03; dùng lệnh Thay vì dùng lệnh drop, ta chọn một hoặc nhiều biến cần xóa ở cửa sổ tên biến, nhấp TRẦN THỊ TUẤN ANH - UEH 17

chuộc phải và chọn mục Drop Selected Variables từ thực đơn hiện ra. 1.4.2. Đổi tên biến trong Stata Tên biến đƣợc đổi bằng lệnh rename Ví dụ, đổi tên biến DT thành tên biến doanhthu Nếu không dùng lệnh, có thể dùng chức năng của Stata. Trƣớc hết, cần hiển thị lại số liệu của các biến đã có bằng lệnh Hoặc có thể chọn nút lệnh browse trên thanh công cụ Sau khi thực hiện lệnh Browse, cửa sổ số liệu sẽ hiện ra TRẦN THỊ TUẤN ANH - UEH 18

Góc trên bên phải của cửa sổ này là danh sách biến, góc dƣới là các tính chất tƣơng ứng của biến đƣợc chọn trên danh sách biến nhƣ tên, kiểu số liệu Do vậy, để đổi tên biến, cần chọn biến cần đổi tên ở danh sách biến và gõ tên mới vào ô Name ở phần properties bên dƣới. Lưu ý : Vì Stata phân biệt chữ hoa và chữ thƣờng rất rõ ràng nên phải cẩn thận vấn đề chữ hoa chữ thƣờng trong tên biến. Đồng thời tên biến không đƣợc có khoảng trắng hoặc các ký tự đặc biệt nhƣ -, *, {, +, %.% # @ ^. 1.4.3. Tạo biến mới từ những biến đã có Dùng lệnh generate hoặc viết gọn là gen Ví dụ tạo biến lndoanhthu bằng logarit cơ số tự nhiên của biến DoanhThu đã có TRẦN THỊ TUẤN ANH - UEH 19

Tên của biến mới sau khi đƣợc tạo sẽ đƣợc thêm vào cửa sổ danh sách biến ở góc phải màn hình chính Hoặc tạo biến DoanhThu2 bằng bình phƣơng của biến DoanhThu Lưu ý : Một số toán tử và hàm số thƣờng dùng trong Stata khi tạo biến hoặc xử lý số liệu Dấu cộng + Dấu trừ - Dấu nhân * Dấu chia / Phủ định ~ Nhỏ hơn < Nhỏ hơn hoặc bằng <= Lớn hơn > Dấu lũy thừa ^ Lớn hơn hoặc bằng >= Toán tử và & Hàm e x : exp() Toán tử hoặc So sánh bằng == So sánh khác!= hoặc ~= Hàm log nepe : ln() TRẦN THỊ TUẤN ANH - UEH 20

1.5. THOÁT KHỎI PHẦN MỀM STATA Để kết thúc sử dụng phần mềm Stata, có thể thoát khỏi phần mềm bằng cách gõ lệnh exit vào cửa sổ lệnh và nhấn phím Enter. Hoặc chọn mục Exit trong thực đơn con của mục File trong thực đơn chính TRẦN THỊ TUẤN ANH - UEH 21

CHƯƠNG 2 : HỒI QUY TUYẾN TÍNH VỚI STATA 2.1. MÔ TẢ SỐ LIỆU Trƣớc khi tiến hành hồi quy, số liệu có thể đƣợc mô tả để kiểm tra xem liệu số liệu có phù hợp với yêu cầu nghiên cứu. 2.1.1. Mô tả tập tin số liệu Dùng lệnh describe để mô tả các thông tin chung nhất về tập tin số liệu nhƣ số quan sát, số biến, kích thƣớc tập tin, tên các biến, kiểu số liệu của từng biến, và nhãn của biến (nếu có) Kết quả mô tả tập tin nhƣ sau 2.1.2. Thực hiện mô tả tóm tắt số liệu Dùng lệnh summarize với cú pháp cơ bản nhƣ sau TRẦN THỊ TUẤN ANH - UEH 22

summarize [varlist] [if] [, options] Ví dụ Lưu ý : Nếu sau lệnh summarize mà không liệt kê tên biến, phần mềm sẽ hiển thị thông tin của tất cả các biến hiện có trong tập tin số liệu. Nếu muốn mô tả chi tiết, có thể tùy chọn detail vào cuối lệnh summarize sau khi đã thêm dấu phẩy TRẦN THỊ TUẤN ANH - UEH 23

2.1.3. Vẽ đồ thị phân tán Stata vẽ đƣợc rất nhiều loại đồ thị nhƣng đồ thị phân tán là dạng đồ thị thƣờng dùng nhất khi phân tích hồ quy. Ngƣởi dùng vẽ đồ thị phân tán của hai biến bằng lệnh scatter scatter [varlist] [if] [, options] scatter thƣờng đƣợc dùng để vẽ đồ thị giữa hai biến.trong varlist, biến đầu tiên đƣợc liệt kê là biến ở trục tung, biến tiếp theo sẽ là biến ở trục hoành. Kết quả thực hiện câu lệnh : Để vẽ đồ thị từ gốc tọa độ hoặc thêm tiêu đề, cần thêm các tùy chọn nhƣ trong câu lệnh sau: TRẦN THỊ TUẤN ANH - UEH 24

Kết quả thực hiện lệnh : Để lƣu đồ thị, dùng lệnh Hoặc có thể nhấn nút lƣu trên thanh công cụ của cửa sổ đồ thị. Sau đó chọn đƣờng dẫn và đặt tên cho đồ thị cần lƣu. Phần mở rộng trong tên đồ thị của Stata là.gph 2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS Trong Stata, ngoài việc ƣớc lƣợng mô hình, phần mềm còn hỗ trợ rất nhiều các kiểm định để đánh giá và lựa chọn mô hình TRẦN THỊ TUẤN ANH - UEH 25

2.2.1. Ƣớc lƣợng mô hình hồi quy tuyến tính bằng phƣơng pháp OLS Hàm hồi quy tuyến tính k biến có dạng nhƣ sau Y X X X U 1 2 2 3 3... k k Hàm hồi quy mẫu tƣơng ứng Y ˆ 1 ˆ ˆ ˆ 2X2 3X3... kx k e Việc ƣớc lƣợng mô hình hồi quy tuyến tính mẫu bằng phƣơng pháp OLS trên Stata đƣợc thực hiện bằng lệnh regress với cú pháp nhƣ sau: regress depvar [indepvars] [if] [, options] Biến đƣợc nhập sau tên lệnh regress là biến phụ thuộc. Tất cả các tên biến đƣợc liệt kê sau biến phụ thuộc là biến độc lập. Tùy chọn [if] đƣợc dùng để giới hạn số liệu cần đƣa vào hồi quy. Ví dụ sau sử dụng số liệu của tập tin doanhthu.dta để hồi quy tuyến tính theo hàm hồi quy DoanhThu ChaoHang QuangCao U 1 2 3 Trong đó : DoanhThu thể hiện doanh thu của doanh nghiệp, đơn vị tính là triệu đồng/tháng. ChaoHang là biến thể hiện chi phí chào hàng (triệu đồng/tháng) QuangCao là chi phí quảng cáo của doanh nghiệp (triệu đồng/tháng) Để hồi quy theo ví dụ trên, trƣớc hết, mở tập tin doanhthu.dta bằng Stata. Sau đó, hồi quy bằng lệnh: Hoặc có thể gọi chức năng hồi quy này từ hệ thống thực đơn chính Statistics/Linear models and related/ Linear regression TRẦN THỊ TUẤN ANH - UEH 26

Khi nhập hàm hồi quy, ta không cần nhập hệ số tự do vì Stata đã mặc định thêm hệ số tự do vào hàm hồi quy. Kết quả hồi quy thu đƣợc nhƣ sau : Từ kết quả trên, hàm hồi quy ƣớc lƣợng đƣợc từ mẫu số liệu bằng phƣơng pháp OLS là DoanhThu 78,915 4, 472ChaoHang 2, 298QuangCao e 2.2.2. Hệ số xác định và kiểm định hệ số xác định Hệ số xác định R 2 giúp đánh giá sự phù hợp của mô hình với mẫu nghiên cứu. Nó cho biết mức độ giải thích của các biến độc lập với sự biến động (quanh giá trị trung bình) của biến phụ thuộc. Ngoài R 2, Stata cũng tính hệ số xác định hiệu chỉnh (Adjusted R 2 ) và hiển thị cả hai trên bảng kết quả hồi quy. TRẦN THỊ TUẤN ANH - UEH 27

2.2.3. Khoảng tin cậy của hệ số hồi quy Xét hàm hồi quy tổng thể Y 1 2X 2 3X 3... kx k U Và hàm hồi quy mẫu tƣơng ứng Y ˆ 1 ˆ ˆ ˆ 2X2 3X3... kx k e Khoảng tin cậy của j,( j 1, k) với độ tin cậy (1 ) đƣợc tính bằng công thức Trong đó : ˆ t se( ˆ ), ˆ t se( ˆ ) j j j j 2 2 t là giá trị có đƣợc khi tra bảng t-student, mức ý nghĩa, bậc tự do n k 2 2 Giá trị này có thể tra đƣợc bằng hàm TINV của Excel hoặc hàm invtail của Stata se( ˆ ) j là sai số chuẩn của ˆ j, đƣợc phần mềm Stata tính sẵn Tuy nhiên, Stata luôn tính sẵn khoảng tin cậy của hệ số hồi quy với độ tin cậy 95%. TRẦN THỊ TUẤN ANH - UEH 28

Nếu muốn thay đổi độ tin cậy, ví dụ 99%, dùng tùy chọn level(99) sau lệnh regress 2.2.4. Kiểm định giả thuyết về hệ số hồi quy a. Kiểm định giả thuyết hai phía Giả sử cần kiểm định giả thuyết hai phía Có 3 cách kiểm định Dùng khoảng tin cậy Dùng thống kê t Dùng p-value H 0 1 : 0 H : 0 j j với độ tin cậy (1 ) Kết quả hiển thị trên Stata hỗ trợ cả ba cách kiểm định này TRẦN THỊ TUẤN ANH - UEH 29

Giả sử cần kiểm định giả thuyết hai phía một số thực bất kỳ. H : 0 j 0 H : 1 j 0 với độ tin cậy (1 ) và 0 là Ví dụ cần kiểm định H 0 1 : 7 ChaoHang H : 7 ChaoHang với độ tin cậy 95% Dùng lệnh test của Stata Kết quả kiểm định nhƣ sau b. Kiểm định giả thuyết phía phải Giả sử cần kiểm định giả thuyết phía phải H 0 1 : 0 H : 0 j j với độ tin cậy (1 ) Dùng thống kê t của kiểm định hai phía mà Stata đã tính sẵn, so sánh với giá trị t có đƣợc khi tra bảng t-student với mức ý nghĩa bậc tự do n k Giả sử cần kiểm định giả thuyết phía phải H : 0 j 0 H : 1 j 0 với độ tin cậy (1 ) Ví dụ, để kiểm định H 0 1 : 7 ChaoHang H : 7 ChaoHang với độ tin cậy (1 ), sử dụng lệnh lincom nhƣ sau : Kết quả sau khi thực hiện lệnh TRẦN THỊ TUẤN ANH - UEH 30

Dùng t có đƣợc từ kết quả trên để so sánh với giá trị t có đƣợc khi tra bảng t-student với mức ý nghĩa bậc tự do n k Để tính p-value của kiểm định này, sau khi chạy lệnh lincom, có thể lần lƣợt thực hiện các lệnh sau Lệnh ttail() để tính p-value của kiểm định một phía dùng phân phối t-student Kết quả thực thi cáclệnh trên nhƣ sau c. Kiểm định giả thuyết phía trái Tƣơng tự nhƣ kiểm định phía phải nhƣng so sánh với giá trị t d. Kiểm định giả thuyết đồng thời liên quan đến tổ hợp tuyến tính các hệ số hồi quy Giả sử cần kiểm định giả thuyết Dùng lệnh test của Stata H 0 1 : H : ChaoHang ChaoHang QuangCao QuangCao với độ tin cậy (1 ) Kết quả thực hiện lệnh TRẦN THỊ TUẤN ANH - UEH 31

Giả sử cần kiểm định giả thuyết Dùng lệnh test của Stata H 0 1 : 2 ChaoHang H : 2 ChaoHang QuangCao QuangCao với độ tin cậy (1 ) Kết quả kiểm định Giả sử cần kiểm định giả thuyết Dùng lệnh test của Stata H 0 1 : 10 ChaoHang ChaoHang QuangCao H : 10 QuangCao với độ tin cậy (1 ) Kết quả 2.3. PHẦN DƢ CỦA MÔ HÌNH HỒI QUY TRẦN THỊ TUẤN ANH - UEH 32

Phần dƣ của mô hình hồi quy đƣợc lấy bằng lệnh 2.3.1. Vẽ biểu đồ histogram của phần dƣ Dùng lệnh histogram để vẽ biểu đồ histogram của phần dƣ Kết quả thực hiện lệnh 2.3.2. Kiểm định tính chuẩn của phần dƣ Dùng lệnh sktest để kiểm định tính chuẩn của sai số. Lệnh này đòi hỏi phải có ít nhất 8 TRẦN THỊ TUẤN ANH - UEH 33

quan sát trong mẫu số liệu. Kết quả hiển thị 2.4. XUẤT NHIỀU KẾT QUẢ HỒI QUY DƢỚI DẠNG BẢNG Để xuất nhiều kết quả hồi quy ra trên cùng một bảng với mỗi phƣơng trình là một cộng trong bảng, ngƣời dùng có thể dùng lệnh esttab với ví dụ minh họa nhƣ sau Kết quả xuất ra dạng bảng nhƣ sau TRẦN THỊ TUẤN ANH - UEH 34

Lưu ý : nếu lệnh esttab chƣa có sẵn trong Stata, có thể cài đặt bằng cách dùng : TRẦN THỊ TUẤN ANH - UEH 35

CHƯƠNG 3 : MỞ RỘNG HỒI QUY TUYẾN TÍNH 3.1. HỒI QUY TUYẾN TÍNH QUA GỐC TỌA ĐỘ Hàm hồi quy tuyến tính đi qua gốc tọa độ khi hệ số tự do bằng 0. Khi đó, hồi quy tổng thể có dạng Y 2X 2 3X 3... kx k U Ƣớc lƣợng hàm hồi quy qua gốc tọa độ bằng lệnh regress với tùy chọn noconstant Kết quả hồi quy 3.2. DẠNG HÀM LOG LOG; DẠNG HÀM LOG LIN; DẠNG HÀM LIN LOG 3.2.1. Dạng hàm log log Dạng hàm log log có dạng ln( Y) 1 2ln( X ) U Ví dụ : cần ƣớc lƣợng dạng hàm ln( DoanhThu) 1 2ln( ChaoHang) U. TRẦN THỊ TUẤN ANH - UEH 36

Các bƣớc cần thực hiện nhƣ sau : Kết quả 3.2.2. Dạng hàm log lin Dạng hàm log lin có dạng ln( Y) 1 2X U Ví dụ : cần ƣớc lƣợng dạng hàm ln( DoanhThu) 1 2ChaoHang U. Các bƣớc cần thực hiện nhƣ sau : Kết quả TRẦN THỊ TUẤN ANH - UEH 37

Lưu ý : Nếu biến lndoanhthu đã có sẵn thì không cần tạo lại bằng lệnh generate 3.2.3. Dạng hàm lin log Dạng hàm log lin có dạng Y ln( X ) U 1 2 Ví dụ : cần ƣớc lƣợng dạng hàm DoanhThu ln( ) 1 2 ChaoHang U. Kết quả Lưu ý : Nếu biến lnchaohang đã có sẵn thì không cần tạo lại bằng lệnh generate TRẦN THỊ TUẤN ANH - UEH 38

3.3. DẠNG HÀM BẬC HAI (QUADRATIC MODEL) Hàm hồi quy dạng bậc hai có phƣơng trình 2 Y 1 2X 3X U Giả sử cần ƣớc lƣợng hàm hồi quy 2 DoanhThu 1 2ChaoHang 3ChaoHang U Các bƣớc thực hiện Kết quả thực hiện TRẦN THỊ TUẤN ANH - UEH 39

CHƯƠNG 4 : HỒI QUY VỚI BIẾN GIẢ 4.1. GIỚI THIỆU BIẾN GIẢ Biến định tính là những biến số kinh tế mà giá trị không thể hiện bằng những con số mà bằng các tính chất mà bằng các lựa chọn. Để đƣa biến định tính vào hồi quy, ngƣời ta sử dụng biến giả (Dummy variable). Biến Dummy là những biến chỉ nhận giá trị 0 và 1. Biến này còn đƣợc gọi là biến nhị phân (Binary variable) hay là biến chỉ mục (indicator variable) 4.2. HỒI QUY VỚI BIẾN GIẢ Sử dụng tập tin số liệu ThuNhapTPHCM.dta, tiến hành mô tả số liệu Trong tập tin này có các biến giả NgoaiNgu, DNNN, HoKhau, GioiTinh. Việc hồi quy với các biến giả này không có gì khác với hồi quy các biến định lƣợng thông thƣờng. Tuy nhiên, việc giải thích hệ số hồi quy của biến giả rất khác với biến định lƣợng. TRẦN THỊ TUẤN ANH - UEH 40

Giả sử cần hồi quy hàm tiền lƣơng có dạng lnthunhap KinhNghiem GioiTinh NgoaiNgu HoKhau U 1 2 4 5 6 Việc hồi quy đƣợc thực hiện bằng câu lệnh sau Kết quả hồi quy 4.3. HỒI QUY VỚI BIẾN TƢƠNG TÁC Giả sử cần tƣơng tác giữa biến KinhNghiem và GioiTinh để xem biến GioiTinh có làm thay đổi tác động biên của KinhNghiem đến biến lnthunhap hay không. Dạng hàm hồi quy với biến tƣơng tác nhƣ sau : lnthunhap KinhNghiem KinhNghiem GioiTinh NgoaiNgu HoKhau U 1 2 3 4 5 Tạo biến tƣơng tác TRẦN THỊ TUẤN ANH - UEH 41

Thực hiện hồi quy Kết quả hồi quy Lưu ý : thay vì dùng hai lệnh để tạo ra biến tƣơng tác rồi hồi quy nhƣ trên, kết quả tƣơng đƣơng có thể đƣợc tạo ra bằng cách dùng một lệnh duy nhất Kết quả thực hiện lệnh TRẦN THỊ TUẤN ANH - UEH 42

4.4. Tạo biến giả từ biến định tính 4.4.1. Tạo bằng lệnh tabulate Trong số liệu của tập tin ThuNhap_TPHCM có biến BangCap là biến định tính với các lựa chọn PTCS(Phồ thông cơ sở), PTTH (phổ thông trung học), CD (Cao đẳng), DH (Đại học), THS (Thạc sỹ) và KH(Khác) Để tạo các biến giả ứng với các lựa chọn của biến bằng cấp, dùng lệnh : Kết quả, Stata sẽ tạo ra 6 biến giả từ BangCap1 đến BangCap6 ứng với 6 lựa chọn, đƣợc mô tả nhƣ sau TRẦN THỊ TUẤN ANH - UEH 43

4.4.2. Dùng biến factor Những biến định tính đƣợc nhập vào theo kiểu số liệu numeric, thay vì tạo biến giả bằng lệnh tabulate, có thể dùng biến factor để đƣa vào mô hình Stata sẽ tự động thêm biến giả vào hàm hồi quy. Số biến giả thêm vào sẽ bằng số lựa chọn của biến BangCap trừ đi 1 TRẦN THỊ TUẤN ANH - UEH 44

4.5. TƢƠNG TÁC GIỮA 2 BIẾN ĐỊNH GIẢ - PHƢƠNG PHÁP DIFFERENCE IN DIFFERENCE Tƣơng tác giữa hai biến giả đƣợc gọi là phƣơng pháp D-I-D trong kinh tế lƣợng. Ví dụ sau tƣơng tác giữa hai biến giả GioiTinh và HoKhau Kết quả thực hiện lệnh 4.6. ƢỚC LƢỢNG HÀM HỒI QUY THEO TỪNG NHÓM Giả sử muốn ƣớc lƣợng một hồi quy thu nhập cho Nam giới và Nữ giới riêng biệt. Câu lệnh có thể dùng trong trƣờng hợp này nhƣ sau TRẦN THỊ TUẤN ANH - UEH 45

Kết quả là sẽ có hai hàm hồi quy đƣợc ƣớc lƣợng Lưu ý : thay vì dùng tùy chọn by hoặc bysort, ta có thể dùng điều kiện if sau lệnh regress TRẦN THỊ TUẤN ANH - UEH 46

Kết quả hồi quy cho nữ giới Kết quả hồi quy cho nam giới Kết quả cũng vẫn giống với dùng lệnh bysort ở trên. TRẦN THỊ TUẤN ANH - UEH 47

CHƯƠNG 5 : ĐA CỘNG TUYẾN 5.1. PHÁT HIỆN ĐA CỘNG TUYẾN Đa cộng tuyến là hiện tƣợng các biến độc lập trong mô hình có mối quan hệ với nhau. Đa cộng tuyến hoàn hảo làm cho mô hình không ƣớc lƣợng đƣợc. Đa cộng tuyến không hoàn hảo có thể làm cho các biến độc lập cộng tuyến mất đi ý nghĩa trong mô hình hoặc có thể bị sai dấu của hệ số hồi quy. Tiếp tục sử dụng tập tin số liệu ThuNhapTPHCM.dta để hồi quy hàm thu nhập nhƣ sau lnthunhap KinhNghiem GioiTinh NgoaiNgu HoKhau U 1 2 3 4 5 Mô hình ƣớc lƣợng đƣợc 5.1.1. Hệ số tƣơng quan Hệ số tƣơng quan giữa các biến độc lập trong mô hình đƣợc tính bằng lệnh correlate TRẦN THỊ TUẤN ANH - UEH 48

Ma trận hệ số tƣơng quan giữa các biến độc lập nhƣ sau 5.1.2. Nhân tử phóng đại phƣơng sai (vif) Mỗi biến độc lập trong mô hình sẽ có một hệ số phóng đại phƣơng sai. Để tìm vif, phải đảm bảo hàm hồi quy vừa chạy gần nhất trƣớc đó là hàm hồi quy cần kiểm định đa cộng tuyến. Sau đó dùng lệnh vif. Kết quả 5.2. PHÁT HIỆN ĐỔI DẤU DO ĐA CỘNG TUYẾN Việc phát hiện sai dấu do đa cộng tuyến có thể thực hiện bằng các so sánh dấu của hệ số tương quan giữa biến phụ thuộc và các biến độc lập với dấu của hệ số hồi quy thu được bằng lệnh regress. Nếu hai dấu này khác nhau, đó là thể hiện của sai dấu cho các biến TRẦN THỊ TUẤN ANH - UEH 49

độc lập có tƣơng quan với nhau. TRẦN THỊ TUẤN ANH - UEH 50

CHƯƠNG 6 : PHƯƠNG SAI THAY ĐỔI Giả sử xét hàm hồi quy tuyến tính Y 2X 2 3X 3... kx k U Mô hình hồi quy tuyến tính cổ điển giả định rằng : EU ( i ) 0 Var U const i n Cov( U, U ) 0, i j 2 ( i), 1, i j Khi giả thiết về sự không đổi của phƣơng sai sai số bị vi phạm sẽ dẫn đến hiện tƣợng phƣơng sai thay đổi. Khi đó, EU ( i ) 0 Var U i n Cov( U, U ) 0, i j 2 ( i) i, 1, i j Vậy làm sao để phát hiện mô hình hồi quy bị phƣơng sai thay đổi? Xử lý phƣơng sai thay đổi nhƣ thế nào? Phần thực hành chƣơng 6 sẽ sử dụng tập tin số liệu Heteroskesdaticity.dta để thực hiện các kiểm định và xử lý khi có phƣơng sai thay đổi. Giả sử hàm hồi quy cần ƣớc lƣợng : Y X X X X U 1 2 2 3 3 4 4 5 5 Kết quả hồi quy TRẦN THỊ TUẤN ANH - UEH 51

6.1. PHÁT HIỆN PHƢƠNG SAI THAY ĐỔI 6.1.1. Đồ thị phần dƣ Một trong những dấu hiện ban đầu cho thấy có sự hiện diện của phƣơng sai thay đổi là sai số phân bố không đồng đều xung quanh giá trị trung bình của nó. Đồ thị thu đƣợc nhƣ sau: Tùy chọn yline(0) để vẽ trục tung của đồ thị. Qua đồ thị cho thấy phần dƣ của mô hình có phân bố không đều quanh giá trị trung bình của nó. Đây là dấu hiệu của phƣơng sai thay đổi. 6.1.2. Kiểm định Breusch Pagan TRẦN THỊ TUẤN ANH - UEH 52

Giả thuyết H 0 của kiểm định Breusch Pagan là mô hình có phƣơng sai thuần nhất, giả thuyết đối H 1 là phƣơng sai của sai số phụ thuộc vào các yếu tố z,..., 2 z : i ki H 0 : 2 2 i H : h( z... z ) 2 2 1 i 2 2i m mi Sau khi hồi quy bằng OLS, Stata hỗ trợ thực hiện kiểm định Breusch Pagan bằng lệnh: Kết quả kiểm định của mô hình trong ví dụ trên là Một cách dùng khác của kiểm định Breusch Pagan Kết quả 6.1.3. Kiểm định White Giả thuyết H0 của kiểm định White H 0 1 : 2 2 i H : i, j : 2 2 i j TRẦN THỊ TUẤN ANH - UEH 53

Kiểm định phƣơng sai thay đổi bằng kiểm định White trên Stata đƣợc thực hiện bằng lệnh : Kết quả thực hiện lệnh Lưu ý : Trong một số trƣờng hợp, nếu phần mềm không hỗ trợ kiểm định phƣơng sai thay đổi bằng gói các câu lệnh đƣợc xây dựng sẵn, ta có thể hồi quy phần dƣ để kiểm tra phƣơng sai thay đổi của sai số. Kết quả nhƣ sau : TRẦN THỊ TUẤN ANH - UEH 54

6.2. XỬ LÝ PHƢƠNG SAI THAY ĐỔI Khi bị phƣơng sai thay đổi, ƣớc lƣợng tính đƣợc bằng phƣơng pháp OLS không còn là ƣớc lƣợng hiệu quả nữa. Đồng thời các kiểm định về hệ số hồi quy đƣợc tính toán dựa trên giả định var( U i ) 2 không còn đáng tin cậy. Việc xử lý hiện tƣợng phƣơng sai thay đổi có thể tính lại giá trị các kiểm định để kiểm định đáng tin cậy hơn (bằng cách dùng ma trận ƣớc lƣợng vững của hiệp phƣơng sai) hoặc tìm ƣớc lƣợng hiệu quả hơn bằng GLS. 6.2.1. Ƣớc lƣợng vững của ma trận hiệp phƣơng sai Sử dụng ƣớc lƣợng vững của ma trận hiệp phƣơng sai sai số do White(1980) đề xuất để tính toán lại các giá trị kiểm định khi có phƣơng sai thay đổi. Trên Stata, việc này đƣợc thực hiện bằng cách thêm tùy chọn robust hoặc vce(robust) sau câu lệnh regress Kết quả TRẦN THỊ TUẤN ANH - UEH 55

Lƣu ý rằng sau khi dùng tùy chọn robust, giá trị các hệ số hồi quy không hề thay đổi. Chỉ có các sai số chuẩn thay đổi dẫn đến thống kê t và p-value của kiểm định các hệ số hồi quy thay đổi. 6.2.2. Phƣơng pháp bình phƣơng nhỏ nhất tổng quát (GLS) Phƣơng pháp GLS để tìm ƣớc lƣợng hiệu quả trong trƣờng hợp phƣơng sai thay đổi đƣợc thực hiện bằng cách tìm trọng số cho sai số; để sau khi hồi quy với trọng số, phƣơng sai của mô hình trở nên không đổi. Do vậy, GLS trong trƣờng hợp phƣơng sai thay đổi còn đƣợc gọi là WLS (Weighted Least Squares Bình phương nhỏ nhất có trọng số) Trong ví dụ trên, trọng số có thể tìm đƣợc nhƣ sau : TRẦN THỊ TUẤN ANH - UEH 56

Kết quả sau khi hồi quy với trọng số Ngoài ra, một số câu lệnh đƣợc viết bởi các nhà nghiên cứu cũng cho phép thực hiện WLS trên Stata nhƣ wls0, vwls TRẦN THỊ TUẤN ANH - UEH 57

CHƯƠNG 7 : TỰ TƯƠNG QUAN Hiện tƣợng tự tƣơng quan thƣờng đƣợc xét đối với số liệu theo thời gian, khi giả thiết về sự không tƣơng quan giữa các sai số bị vi phạm. Giả sử xét hàm hồi quy Y 1 2X U t t t Chƣơng 7 sử dụng số liệu của tập tin GiaXangDau.dta để thực hiện các kiểm định và xử lý tự tƣơng quan. Mô tả tập tin số liệu nhƣ sau: Giả sử hàm hồi quy cần thực hiện: giaxangvietnam giaxangthegioi U t 1 2 t t Để Stata nhận dạng số liệu theo thời gian, cần dùng lệnh tsset Biến quarter là biến dùng để chỉ định thời gian trong tập tin số liệu này. Hồi quy m6 hình TRẦN THỊ TUẤN ANH - UEH 58

với phƣơng pháp OLS, kết quả ƣớc lƣợng ban đầu nhƣ sau : 7.1. KIỂM ĐỊNH TỰ TƢƠNG QUAN 7.1.1. Đồ thị phần dƣ Các câu lệnh thực hiện để vẽ đồ thị phần dƣ : Đồ thị biểu diễn phần dƣ thu đƣợc nhƣ sau: TRẦN THỊ TUẤN ANH - UEH 59

7.1.2. Biểu đồ tự tƣơng quan ( ACF - Autocorrelation Function) Biểu đồ tự tƣơng quan biểu diễn hệ số tự tƣơng quan từ bậc 1 đến bậc k của một đại lƣợng ngẫu nhiên lên cùng một đồ thị. Để biểu diễn biểu đồ tự tƣơng quan từ bậc 1 đến bậc 12 của biến phandu, câu lệnh đƣợc sử dụng nhƣ sau Biểu đồ hiện ra nhƣ sau 7.1.3. Kiểm định Durbin Watson Sau khi ƣớc lƣợng hàm hồi quy, để tính giá trị thống kê d theo kiểm định Durbin Watson, cần thực thi câu lệnh: Kết quả TRẦN THỊ TUẤN ANH - UEH 60

Với giá trị thống kê d tính đƣợc, ta tra bảng Durbin-Watson, tìm ra giá trị dl và du, kẻ thang kiểm định Durbin Watson và kết luận vê tự tƣơng quan bậc nhất. Ngoài ra, Stata hỗ trợ việc kiểm định tự tƣơng quan bậc nhất bằng Durbin Watson thông qua việc tính sẵn giá trị p-value cho kiểm định này. Kết quả p-value đƣợc hiển thị ra nhƣ sau : 7.1.4. Kiểm định Breusch Godfrey Kiểm định BG trên Stata đƣợc hỗ trợ bằng câu lệnh estat bgodfrey. Khi kiểm định BG trên Stata cần chỉ rõ bậc tự tƣơng quan cần kiểm định. Nếu không chỉ rõ bậc tự tƣơng quan, phần mềm sẽ mặc định kiểm định tự tƣơng quan bậc 1. Ví dụ, để kiểm định tự tƣơng quan từ bậc 1 đến bậc 4 Kết quả kiểm định tƣơng ứng TRẦN THỊ TUẤN ANH - UEH 61

Nếu chỉ cần kiểm định tự tƣơng quan bậc 1 và bậc 4 (nghĩa là không kiểm định tự tƣơng quan bậc 2 và 3), câu lệnh đƣợc dùng sẽ là: Kết quả thực hiện lệnh 7.2. XỬ LÝ TỰ TƢƠNG QUAN Cũng giống nhƣ trƣờng hợp phƣơng sai thay đổi, hiện tƣợng tự tƣơng quan cũng làm cho ƣớc lƣợng OLS không còn là ƣớc lƣợng hiệu quả nhất và các kiểm định về hệ số hồi quy cũng không còn đáng tin cậy. Do đó, việc khắc phục có thể theo hai hƣớng. Một là, làm cho kiểm định hệ số hồi quy đáng tin cậy hơn bằng ma trận ƣớc lƣợng hiệp phƣơng sai của Newey West. Hai là, tìm ƣớc lƣợng hiệu quả bằng GLS. 7.2.1. Ma trận ước lượng hiệp phương sai Newey - West Để sử dụng ma trận ƣớc lƣợng hiệp phƣơng sai, cần chỉ định rõ bandwidth đƣợc sử dụng TRẦN THỊ TUẤN ANH - UEH 62

để tính toán ma trận ƣớc lƣợng hiệp phƣơng sai. Bandwidth có thể đƣợc tính toán bằng công thức B 1 0.75T 3 hoặc 2 9 B 4 T. Stata không dùng bandwidth mặc định nhƣ 100 một số phần mềm khác nên ngƣời dùng thƣờng phải chỉ định con số này. Để tính toán bandwidth, ta \có thể dùng các câu lệnh sau Kết quả bandwidth đƣợc chọn sẽ là Với bandwidth = 3, mô hình hồi quy đƣợc thực hiện với ma trận ƣớc lƣợng hiệp phƣơng sai của Newey West nhƣ sau : Kết quả thực hiện câu lệnh trên 7.2.2. Khắc phục tự tương quan bằng GLS thủ tục Prais - Winsten TRẦN THỊ TUẤN ANH - UEH 63

Một thủ tục phổ biến của GLS để xử lý trong trƣờng hợp tự tƣơng quan bậc nhất đƣợc đề xuất bởi Prais Winsten(1954). Stata thực hiện thủ tục này bằng lệnh prais. Cú pháp lệnh này rất giống lệnh regress Kết quả thực hiện Lệnh prais có các tùy chọn để tính hệ số tự tƣơng quan rho khác nhau (gõ help prais để xem trợ giúp của Stata về các tùy chọn này). TRẦN THỊ TUẤN ANH - UEH 64

TÀI LIỆU THAM KHẢO Lee C. Adkins & R. Carter Hill (2011), Using Stata for Principles of Econometrics, 4 th edition, Wiley Publisher. White, H. (1980), A Heteroscedasticity-Consistent Covariance Matrix Es timator and a Direct Test for Heteroscedasticity. Econometrica 48, 817-838. Prais, S. J. and Winsten D. B., (1954), Trend Estimators and Serial Correlation Cowles Commission, Discussion Paper No. 383, University of Chicago. TRẦN THỊ TUẤN ANH - UEH 65