Giá vé máy bay - Phân tích nào nên được sử dụng để phát hiện hành vi thiết lập giá cạnh tranh và tương quan giá?


12

Tôi muốn điều tra hành vi thiết lập giá của các hãng hàng không - cụ thể là cách các hãng hàng không phản ứng với giá của đối thủ cạnh tranh.

Như tôi muốn nói kiến ​​thức của tôi về phân tích phức tạp hơn khá hạn chế, tôi đã thực hiện hầu hết tất cả các phương pháp cơ bản để thu thập một cái nhìn tổng thể về dữ liệu. Điều này bao gồm các biểu đồ đơn giản đã giúp xác định các mẫu tương tự. Tôi cũng đang sử dụng SAS Enterprise 9.4.

Tuy nhiên tôi đang tìm kiếm một cách tiếp cận dựa trên số lượng nhiều hơn.

Tập dữ liệu

Tập dữ liệu (tự) được thu thập tôi đang sử dụng chứa khoảng ~ 54.000 giá vé. Tất cả giá vé được thu thập trong một cửa sổ thời gian 60 ngày, trên cơ sở hàng ngày (mỗi đêm lúc 00:00).Phương pháp thu thập

Do đó, mọi giá vé trong cửa sổ thời gian đó xảy ra n lần tùy thuộc vào sự sẵn có của giá vé cũng như ngày khởi hành của chuyến bay, khi nó được thông qua ngày thu tiền vé. (Bạn không thể thu tiền vé cho chuyến bay khi ngày khởi hành của chuyến bay đã qua)

Các định dạng không được định dạng trông cơ bản như thế này: (dữ liệu giả)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysB BeforeDeparture" được tính thông qua Tôi= =S-c trong đó

  • Tôi & khoảng (ngày trước khi khởi hành)
  • s & ngày của giá vé (chuyến bay khởi hành)
  • c & ngày mà giá vé được thu thập

Dưới đây là ví dụ về dữ liệu được nhóm bởi I (DaysB BeforeDep.) (Dữ liệu giả mạo!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Những gì tôi đã đưa ra cho đến nay

Nhìn vào biểu đồ đường tôi đã có thể ước tính rằng một số dòng sẽ có hệ số tương quan cao. Do đó, tôi đã cố gắng sử dụng phân tích tương quan trước tiên trên dữ liệu được nhóm. Nhưng đó có phải là cách chính xác? Về cơ bản, tôi cố gắng bây giờ để thực hiện các mối tương quan trên mức trung bình thay vì giá cá nhân? Có cách nào khác không?

Tôi không chắc mô hình hồi quy nào phù hợp ở đây, vì giá không di chuyển ở bất kỳ dạng tuyến tính nào và xuất hiện phi tuyến tính. Tôi có cần phải phù hợp với một mô hình cho từng diễn biến giá của một hãng hàng không

PS: Đây là một bức tường văn bản dài. Nếu tôi cần làm rõ bất cứ điều gì cho tôi biết. Tôi mới đến phụ này.

Có ai là đầu mối không? :-)

Câu trả lời:


9

Lời cảnh báo từ một nhà phân tích Quản lý doanh thu hàng không trước đây: bạn có thể đang sủa sai cây với phương pháp này. Lời xin lỗi cho bức tường văn bản theo sau, nhưng dữ liệu này phức tạp và ồn ào hơn nhiều so với cái nhìn đầu tiên, vì vậy muốn cung cấp một mô tả ngắn về cách nó được tạo ra; báo trước được báo trước.

Giá vé máy bay có hai thành phần: tất cả giá vé thực tế (hoàn chỉnh với quy tắc giá vé và những gì bạn có) mà một hãng hàng không có sẵn cho một tuyến nhất định, hầu hết đều được xuất bản Công ty xuất bản hàng không (một số ít sử dụng đặc biệt không, nhưng đó là những ngoại lệ chứ không phải là quy tắc) và việc quản lý hàng tồn kho thực tế được thực hiện bởi hãng hàng không trên cơ sở hàng ngày.

Giá vé có thể được gửi tới ATPCO bốn lần một ngày, theo các khoảng thời gian đã định và khi các hãng hàng không làm như vậy, thông thường sẽ bao gồm một hỗn hợp bổ sung, xóa và sửa đổi giá vé hiện có. Khi một hãng hàng không bắt đầu hành động định giá (giả sử đối thủ cạnh tranh của họ không cố gắng thực hiện các động thái của riêng họ ở đây), họ thường phải đợi đến bản cập nhật tiếp theo để xem liệu đối thủ của họ có theo dõi / phản hồi hay không. Cuộc trò chuyện diễn ra khi một đối thủ cạnh tranh bắt đầu một hành động định giá, vì hãng hàng không phải đợi đến bản cập nhật tiếp theo trước khi họ có thể phản hồi.

Bây giờ, điều này rất tốt và tốt đối với giá vé, nhưng vấn đề là ở chỗ, bởi vì tất cả đều được công bố trên ATPCO, giá vé là điều tốt nhất tiếp theo đối với thông tin công khai ... tất cả các đối thủ của bạn đều biết bạn đã làm gì có trong kho vũ khí của bạn, vì vậy những nỗ lực làm xáo trộn không phải là chưa từng thấy, chẳng hạn như xuất bản giá vé sẽ không bao giờ thực sự được chỉ định bất kỳ hàng tồn kho, liệt kê tất cả giá vé là ngày khởi hành, v.v.

Theo nhiều cách, nước sốt bí mật đi xuống phân bổ hàng tồn kho thực tế, tức là bạn sẽ sẵn sàng bán bao nhiêu ghế trên mỗi chuyến bay cho một giá vé nhất định và thông tin này không được công khai. Bạn có thể nhận được một vài cái nhìn thoáng qua bằng cách tìm hiểu thông tin web, nhưng các kết hợp tiềm năng của thời gian khởi hành / ngày và quy tắc giá vé là khá nhiều và có thể nhanh chóng leo thang vượt quá khả năng của bạn để dễ dàng theo dõi.

Thông thường, một hãng hàng không sẽ chỉ sẵn sàng bán một số ghế với giá vé rất thấp và những người mắc kẹt phải đặt trước khá xa vì sợ rằng các quy tắc giá vé sẽ khóa họ, hoặc những khách du lịch khác chỉ đơn giản là đánh bại họ. Các hãng hàng không sẽ sẵn sàng bán thêm một vài chỗ với giá vé cao hơn, v.v. Họ sẽ rất vui khi bán tất cả các ghế với giá vé cao nhất mà họ đã xuất bản, nhưng điều này thường không khả thi.

Những gì bạn đang thấy với giá vé càng cao thì bạn càng đến gần ngày khởi hành chỉ đơn giản là quá trình tự nhiên để có chỗ ngồi giá rẻ được đặt xa hơn, trong khi hàng tồn kho còn lại dần trở nên đắt hơn. Tất nhiên, có một số hãy cẩn thận ở đây. Quá trình RM được quản lý tích cực và sự can thiệp của con người khá phổ biến vì nhóm RM thường cố gắng đáp ứng các mục tiêu doanh thu và tối đa hóa doanh thu trên mỗi chuyến bay. Do đó, các chuyến bay lấp đầy nhanh chóng có thể được "thắt chặt" bằng cách đóng giá vé thấp. Các chuyến bay được đặt chậm có thể được "nới lỏng" bằng cách phân bổ nhiều ghế hơn cho giá vé thấp hơn.

Có sự tương tác và cạnh tranh liên tục giữa các hãng hàng không trong lĩnh vực này, nhưng bạn không có khả năng nắm bắt được các động lực thực tế chỉ từ việc giảm giá vé. Đừng hiểu sai ý tôi, chúng tôi đã có những công cụ như vậy theo ý của chúng tôi và mặc dù có những hạn chế, chúng khá có giá trị, nhưng chúng chỉ là một nguồn dữ liệu được đưa vào quá trình ra quyết định. Bạn cần có quyền truy cập vào hàng trăm, nếu không phải là hàng ngàn quyết định hoạt động được đưa ra bởi các nhóm RM hàng ngày, cũng như thông tin hiện đại như họ thấy vào thời điểm đó. Nếu bạn không thể tìm một đối tác hàng không để làm việc để có được dữ liệu này, bạn có thể cần phải xem xét các nguồn dữ liệu thay thế.

Tôi khuyên bạn nên xem xét việc truy cập vào dữ liệu giá vé O & D từ Hướng dẫn hàng không chính thức (hoặc một trong những đối thủ cạnh tranh của họ) và thử sử dụng dữ liệu đó để phân tích. Đó là dựa trên mẫu (khoảng 10% tổng số vé được bán) và được tổng hợp ở mức cao hơn mức lý tưởng nên việc lựa chọn tuyến đường cẩn thận là bắt buộc (Tôi muốn giới thiệu một số thứ với nhiều hãng hàng không, bay không ngừng nhiều lần trong ngày, với máy bay lớn), nhưng bạn có thể có được bức tranh rõ hơn về những gì thực sự được bán (giá vé trung bình) và số lượng của nó đã được bán (hệ số tải), so với chỉ những gì có sẵn để bán tại một thời điểm nhất định. Sử dụng thông tin đó, bạn có thể ở vị trí tốt hơn để ít nhất khám phá kết quả của chiến lược giá của các hãng hàng không và đưa ra suy luận của bạn từ đó.


Cảm ơn bạn đã giải thích cặn kẽ. Tôi đồng ý với bạn rằng phân tích như vậy chỉ dựa trên giá cả là khá hạn chế. Điều này cũng bao gồm các quy tắc giá vé đáng chú ý (vé hoàn tiền, thời gian lưu trú tối thiểu, v.v.) Một số hạn chế đó có thể được khắc phục bằng cách thu thập giá vé luôn giống nhau để có thể so sánh. Tuy nhiên, một thông tin quan trọng - như bạn đã đề cập, thiếu số lượng ghế có sẵn (có thể! = Chỗ ngồi trên máy bay) và số lượng vé thực sự đã bán.
s1x

Truy cập vào dữ liệu đó rất hạn chế và nếu - lỗi thời (ví dụ: Databank 1B từ US DOT). Một số nghiên cứu như Clark R. và Vincent N. (2012) Liên kết định giá theo năng lực [...] bao gồm dữ liệu đó và cung cấp những hiểu biết tốt hơn nhiều. Tôi nhận thức được những hạn chế (hy vọng ;-)) và như bạn đã đề cập vì có nhiều thông tin ảnh hưởng đến giá cả. Tuy nhiên, khi quan sát một thị trường cụ thể, bạn có thể có cảm giác về những gì xảy ra. Bạn có thể thấy nếu có bất kỳ hành vi cạnh tranh và cách tiếp cận chiến lược giá khác nhau. Tuy nhiên, bạn sẽ không bao giờ có thể tìm ra nguyên nhân.
s1x

1
@ s1x - Tôi đồng ý và tôi ước mình có một lựa chọn thay thế chắc chắn để cung cấp, nhưng, như bạn đã tự học, dữ liệu doanh thu chi tiết là bí mật được bảo vệ cẩn thận nhất tại bất kỳ hãng hàng không nào. Chỉ muốn đảm bảo rằng bạn biết về điều đó và những gì diễn ra trong quá trình tạo dữ liệu. Ngoài ra, tôi thích những gì bạn đang cố gắng thực hiện và tôi nghĩ câu trả lời khác là một bước đi đúng hướng, đúng kỹ thuật. Nếu tôi có thể đề xuất, bạn cũng có thể xem qua việc sử dụng mối tương quan chéo giữa các TS khác nhau của bạn trong quá trình khám phá dữ liệu của bạn, vì nó thường có giá trị cho các mẫu sáng suốt giữa các TS được liên kết.
habu

4

Ngoài phân tích dữ liệu khám phá (EDA), cả mô tả và trực quan, tôi sẽ cố gắng sử dụng phân tích chuỗi thời gian như một phân tích toàn diệntinh vi hơn . Cụ thể, tôi sẽ thực hiện phân tích hồi quy chuỗi thời gian . Phân tích chuỗi thời gian là một lĩnh vực nghiên cứu và thực hành khổng lồ, vì vậy, nếu bạn không quen thuộc với các nguyên tắc cơ bản, tôi khuyên bạn nên bắt đầu với bài viết Wikipedia được liên kết ở trên, dần dần tìm kiếm các chủ đề cụ thể hơn và đọc các bài báo, bài báo và sách tương ứng.

Do phân tích chuỗi thời gian là một cách tiếp cận rất phổ biến , nó được hỗ trợ bởi hầu hết các môi trường thống kêkhoa học dữ liệu thương mại nguồn mở và mã nguồn mở , như R , Python , SAS , SPSS và nhiều thứ khác. Nếu bạn muốn sử dụng R cho việc này, hãy kiểm tra câu trả lời của tôi về phân tích chuỗi thời gian chungphân loại và phân cụm chuỗi thời gian . Tôi hy vọng rằng điều này là hữu ích.


Cảm ơn câu trả lời của bạn @Aleksandr Blekh - thực sự đánh giá cao. Ill digg ngay vào đó. Có thể là một câu hỏi ngu ngốc, nhưng xin vui lòng sửa cho tôi ở đây nếu tôi sai ở đây: một phân tích tương quan, trong khi sử dụng một hãng hàng không làm biến để tương quan. Kết quả rất hấp dẫn cho đến nay, khi một số hãng hàng không đặc biệt. những người đã có thỏa thuận liên danh có giá tương tự. Sẽ có tương quan cao như vậy, ví dụ: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 Tôi giả sử kết quả như vậy chỉ ra các mẫu giá tương tự. Với phân tích hồi quy, tôi sẽ tìm ra điều gì?
s1x

@ s1x: Tất nhiên, bạn rất hoan nghênh (hãy thoải mái nâng cấp / chấp nhận, nếu bạn coi trọng câu trả lời và khi nào bạn sẽ có đủ danh tiếng để làm điều đó, tất nhiên). Bây giờ, về câu hỏi của bạn. Như tôi đã nói, phân tích TS tinh vi và toàn diện hơn. Trong hồi quy TS cụ thể, các tài khoản được gọi là tự phát và các phức tạp TS khác. Do đó, tôi đề nghị sử dụng phân tích hồi quy TS thay vì phân tích truyền thống đơn giản hơn. Ngoài ra, bạn phải luôn bắt đầu với EDA, bất kể bạn dự định thực hiện phân tích dữ liệu nào (thực ra, EDA sẽ thường thay đổi kế hoạch của bạn).
Alexanderr Blekh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.