Các dạng dữ liệu trong phân tích hồi quy
Trong phân tích hồi quy chúng ta thường dùng 3 loại dữ liệu phổ biến :
1) Dữ liệu chuỗi thời gian:
Là các số liệu được thu thập trong một thời kỳ, một khoảng thời gian nhất định. Ví dụ như các số liệu về GDP, giá điện, dân số hay giá trị sản xuất..
year | CPI | Lai_suat | GTSX_CN | PA |
2007M1 | 111.0 | 6.5 | 49,212.0 | 12,000.0 |
2007M2 | 113.4 | 6.5 | 35,392.0 | 12,000.0 |
2007M3 | 113.1 | 6.5 | 45,154.0 | 12,000.0 |
2007M4 | 113.7 | 6.5 | 47,344.6 | 12,000.0 |
2007M5 | 114.5 | 6.5 | 47,953.4 | 12,000.0 |
2) Dữ liệu chéo
Là các số liệu về một hoặc nhiều biến được thu thập tại một thời điểm ở nhiều địa phương, đơn vị khác nhau.
Tỉnh | GTSX_CN | GTSX_TM |
Hà Nội | 2345 | 1244 |
HCM | 2436 | 1242 |
Đà Nẵng | 3454 | 1222 |
Hải Phòng | 2333 | 1111 |
3) Dữ liệu bảng
(hỗn hợp theo không gian và thời gian). Ví dụ như các số liệu về giá USD hàng ngày ở Hà Nội, Hải Phòng, Huế…
Năm | Tỉnh | GTSX_TM | GTSX_CN |
2008 | Ha Noi | 1244 | 4577 |
2009 | Ha Noi | 1242 | 4575 |
2010 | Ha Noi | 1222 | 4555 |
2011 | Ha Noi | 1111 | 4444 |
2008 | HCM | 2244 | 5577 |
2009 | HCM | 2242 | 5575 |
2010 | HCM | 1422 | 4755 |
2011 | HCM | 1151 | 4484 |
Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *