はじめに
一般には,企業体の資産の多くは陳腐化し,会計上は減価償却されるものである. しかし,収益管理における陳腐化資産とは,会計上の資産としては長期にわたって価値をもつものであるが,短期的な意味でその価値がなくなるものを指す. その代表例として航空機の座席がある.つまり,航空機の座席自体は,航空機会社の資産としてその価値は徐々に減価償却されるものであるが,ある特定の時期の,特定の便の,特定の座席(たとえばファーストクラスの窓際の席)は, 乗客を確保できなければ収益を生むことができないので,その価値を失うと考えるのである.
航空機の座席以外にも,列車や船の座席(寝台),ホテルや旅館の部屋, レンタカー,ゴルフ場におけるプレーの権利,相撲や野球の観戦券,テレビのコマーシャルの時間帯, コインパーキングの駐車場なども陳腐化資産である. 見方によっては,生鮮食料品なども期限がくると急速にその価値を失うので陳腐化資産と考えられるが, ほとんどの研究は,航空機や電車の座席,ホテルや旅館などの宿泊施設の部屋,レンタカーに代表されるレンタル商品など, 長期的な観点における資産の所得の可否は固定されているものの, 特定の時期におけるその利用が商品として販売されているものを対象としている.
これらの陳腐化資産に対して,適当な時期における適当な価格付けや資産の在庫への需要の割り当てを行い, 顧客の需要を適切に管理(および創生)することによって,企業体の収益を向上させることができる. これが収益管理(revenue management)よばれる理論および実務の体系である. 従来は,「報酬管理」の用語が多く用いられていたが,最近は報酬(費用を考慮しない収入)だけを目的とするのではなく,収入から費用を減じたものを最大化することを目的とすることを強調するために, 「収益管理」という用語が用いられるようになった.ここでも,それにならい収益管理とよぶことにする.
動的価格最適化(ダイナミックプライシング)
価格 $p$ を離散値から選択し,収益の最大化を行う. すなわち,行動は価格であり,その集合を $A$, 行動の数を $K=|A|$ とする.
需要 $d$ は価格の関数であり,以下の線形関数と仮定する.
$$d = \beta_0 + \beta_1 p + \epsilon$$
ただし,パラメータ $\beta$ は未知であり,学習しながら最適化を行うものとする.
そのために,強化学習(文脈バンデット)を用いる.
行動は価格 $p$ であり, それを与えると環境は需要量を返す. 報酬関数は $p d$ であり,すべての期間 $1,2,\ldots,T$ における報酬の合計を最大化する.
$1$ から $T$ までの期を,エポックと呼ばれる部分区間に分割する. $m$ 番目エポックの終了期を $\tau_m = 2^m (m=1,2,\cdots)$ と設定する.
エポックは期間 $[\tau_{m-1}+1, \tau_m]$ (ただし $\tau_0=0$と仮定)となる.
まず, エポック $m (\geq 1)$ では,$t \in [1, \tau_{m-1}]$ の価格と需要の組 $(p_t,d_t)$ をもとに, 最小二乗法で需要・価格関数のパラメータ $\hat{\beta}$ の推定を行う.
次に, $t =\tau_{m-1}+1, \ldots, \tau_m$ に対して,以下を実行する.
パラメータ $\hat{\beta}$ に対して最も利益が高くなる価格 $\hat{p}$ を計算する. 最大報酬 $\hat{f} = \hat{p} (\hat{\beta}_0 + \hat{\beta}_1 \hat{p})$ との差に応じて,ランダムに他の価格も選択する. (エポック $1$ では価格と需要のデータがないので,ランダムに価格を選び $\hat{p}$ とする.)
具体的には,確率的保証を与えるためのパラメータ $\delta$ に対して,以下のようにステップサイズを決める(ただし $\tau_1=1$).
$$ \gamma_m = (1/30) \sqrt{(K \tau_{m-1})/\log(\tau_{m-1}/\delta)} $$行動 $a$ に対する報酬関数の推定値 $\hat{f}(a)$ に対して,以下に定義される確率 $P$ によって行動を決める. $$ a^* = \arg\max \hat{f}(a) $$
$$ P(a) = \left\{ \begin{array}{ll} 1/(K+\gamma_m (\hat{f}(a^*)- \hat{f}(a)) & a \neq a^* \\ 1- \sum_{a \neq a^*} P(a) & a = a^* \end{array} \right. $$選択された価格に対して環境から需要が返される.価格と需要の組 $(p_t,d_t)$ を保管する.
需要量の合計(在庫量)に制限がある場合は,動的計画もしくは強化学習で最適な行動(価格)を求めてから, 1期の報酬でなく,最終期までの期待利得を用いて価格をランダムに選択する.
この際,予測の誤差も加味して強化学習を適用する方法も考えられる. これは新しいアプローチであり,実験的解析で有効性を確認する必要がある.
動的計画による価値関数の推定
需要関数 $d = \beta_0 + \beta_1 p$ であると仮定したとき, 期 $t$ と残り在庫(容量) $c$ のときの,それ以降の期の報酬の合計(価値関数) $V(t,c)$ は以下の再帰式で計算できる.
$$ V(t,c) = \max_{p} \left\{ (\beta_0 + \beta_1 p)p +V(t+1,c-(\beta_0 + \beta_1 p)) \right\} $$残り在庫に対する費用が $0$ であると仮定したときの初期条件は,以下のようになる.
$$V(t,0) = 0 \ \ \forall t=0,1,\ldots,T-1$$ $$V(T,c) = 0 \ \ \forall c=0,1,\ldots,C$$残り在庫 $1$ あたりに費用 $h$ を課す場合には,2番目の初期条件を以下のように変更する.
$$V(T,c) = hc \ \ \forall c=0,1,\ldots,C$$需要と容量を離散値で近似して,動的計画を適用する.
期数と容量大きい場合には,関数近似を行う必要がある.
import plotly.express as px
# fig = px.imshow(V.T)
# plotly.offline.plot(fig);
fig = px.imshow(A[:,:])
plotly.offline.plot(fig);
座席の価値が 0 になる時刻(航空機の出発する時刻)を 0 とし,現在時刻を $T$ とする. すなわち,時刻は $T,T-1,\cdots,t+1,t,t-1,\cdots,0$ と未来になるにつれ小さくなるように添え字をつけるものとする (カウントダウンと思えば良い).
ホテルやレンタカーなどへの応用の場合には,無限期間を考える必要があるが, 無限期間の問題を有限期間の問題に帰着させるための常套手段である ローリング・ホライズン方式(rolling horizon method)を用いるものと仮定する. ここで,ローリング・ホライズン方式とは,現在時刻 $T$ から最終時刻 $0$ までの問題を解くことによって, 現時点での意思決定を行い,次の期($T-1$期)の意思決定の際には,時刻を $1$ 進めて, $T-1$期から $-1$ 期までの問題を解き,という具合に無限期間を有限期間で近似する方式である
行程(資源)の数を $\ell$, 旅程(需要、サービス)の数を $m$ とする. 行程 $i$ の残り数を行程の容量とよび, 現時点(時刻 $T$)における行程 $i$ の容量を $N_i$ と記す. 旅程 $j$ は,旅程に含まれる行程の集合と運賃クラスによって特徴づけられる. 旅程 $j$ の運賃(収益)を $R_j$,行程が旅程に含まれることを表す行列を $A=[a_{ij}]$ とする. ここで $a_{ij}$ は,旅程 $j$ が行程 $i$ を含むとき $1$,それ以外のとき $0$ を表す. より一般的には,$a_{ij}$ は $0$ 以上の整数をとる場合もある. たとえば,$10$人単位の団体客の場合には団体割引価格を適用する場合には,$a_{ij}=10$ となる.
時刻 $t$ から時刻 $0$ の間の旅程(需要、サービス)$j$ の総和を表す確率変数を $D^t_j$,その期待値を $E[D^t_j]$ と記す. 旅程 $j$ を受け入れる総数を表す変数 $y_j$ を導入する. 実際には座席数は整数であるが,座席数はある程度大きい整数と考え,実数に緩和して適当な丸め操作で整数に変換する方法を用いるものとする.
旅程に行程(資源)の容量 $n_i (i=1,\cdots,\ell)$ を割り振る線形計画問題は,以下のようになる. $$ \begin{array}{l r l l } LP(n,E[D^t]) &= maximize & \sum_{j=1}^m R_j y_j & \\ & s.t. & \sum_{j=1}^m a_{ij} y_j \leq n_i & \forall i=1,\cdots,\ell \\ & & 0 \leq y_j \leq E[D^t_j] & \forall j=1,\cdots,m \end{array} $$
上式で最初の制約は,資源の容量制約であり,2番目の制約は需要量の上限制約である.
確率変数 $D^t$ を離散化して近似する方法も実務的には有効である. いま,$t$ 期以降に旅程 $j$ が発生する量を表す確率変数 $D_j^t$ が互いに独立であり, $K$ 個の離散的な値 $\Delta_{j1}< \Delta_{j2}< \cdots <\Delta_{j K}$ をとるものとする. また,旅程 $j$ の受け入れ総数を表す変数 $y_j$ は,$K$個の変数 $z_{jk} (k=1,\cdots,K)$ に分解して扱う. 以下の確率的線形計画問題は,変数 $z_{jk}$ を確率変数の実現値を知る前に決定するので,即時決定(here and now)アプローチとよばれる.
$$ \begin{array}{l r l l } SLP(n,D^t) &= maximize & \sum_{j=1}^m \sum_{k=1}^K R_j \Pr \{D_j^t \geq \Delta_{jk} \} z_{jk} & \\ & s.t. & \sum_{j=1}^m a_{ij} \sum_{k=1}^K z_{jk} \leq n_i & \forall i=1,\cdots,\ell \\ & & 0 \leq z_{j 1} \leq \Delta_{j1} & \forall j=1,\cdots,m \\ & & 0 \leq z_{j k} \leq \Delta_{jk}-\Delta_{j,k-1} & \forall j=1,\cdots,m, k=2,\cdots,K \end{array} $$この問題は,単純リコース(simple recourse)をもつ確率計画問題と解釈できる. 変数 $z_{jk}$ を確率変数の実現値を知る前に決定し,この時点では収益 $R_j z_{jk}$ を得るものとする. 確率変数 $D_j^t$ の実現値が $\Delta_{jk}$ 未満の場合には, 実際には需要がなかったので $z_{jk}=0$ となり, リコース費用(recourse cost)$R_j z_{jk}$ を支払うものとする. 確率変数 $D_j^t$ の実現値が $\Delta_{jk}$ 未満になる確率は,$\Pr \{D_j^t < \Delta_{jk} \}$ であるので, 目的関数は, $$ \sum_{j=1}^m \sum_{k=1}^K R_jz_{jk} - \sum_{j=1}^m \sum_{k=1}^K R_j \Pr \{D_j^t < \Delta_{jk} \} z_{jk} =\sum_{j=1}^m \sum_{k=1}^K R_j \Pr \{D_j^t \geq \Delta_{jk} \} z_{jk} $$ となる.
需要の期待値 $E[D^t]$ を用いるかわりに,確率変数 $D^t$ をサンプリングすることによって近似の精度を上げる方法が提案されている. 確率変数 $D^t$ を入力とした以下の線形計画問題を解く. $$ \begin{array}{l r l l } LP'(n,D^t) &= maximize & \sum_{j=1}^m R_j y_j & \\ & s.t. & \sum_{j=1}^m a_{ij} y_j \leq n_i & \forall i=1,\cdots,\ell \\ & & 0 \leq y_j \leq D^t_j & \forall j=1,\cdots,m \end{array} $$
$D^t_j$ のサンプルを適当な個数発生させ,各々のサンプルに対して線形計画問題を解くことによって $LP'(n,D^t)$ の期待値を得る. このアプローチは,確率変数の実現値を知った後で最適化を行うので, 待機決定(wait and see)の確率計画モデルと考えられる.
入札価格コントロール方策
ここでは,線形計画問題を解くことによって得られる双対変数の情報を用いた在庫コントロール方策について考える. 線形計画問題における容量制約に対する最適双対変数を $v_i (i=1,\cdots,\ell)$ とする. 在庫割り当てモデルにおいては,$v_i$ は行程に対する入札価格(bid price)とよび, 旅程に含まれる行程の入札価格の和で機会費用 $OC_j(n,t)$ を近似する.
旅程 $j$ に含まれる行程の入札価格の和が,旅程の収益以下であれば,その旅程は受け入れられ,それ以外の場合は拒否される. すなわち,入札価格 $v$ を用いた近似方策は,旅程 $j$ が発生したときに, $$ \begin{array}{l c l } R_j \geq \sum_{i: a_{ij}=1} v_i & \Rightarrow & 受け入れ \\ それ以外 & \Rightarrow & 拒否 \end{array} $$ とする方策である。このような予約のさばき方を入札価格コントロール方策(bid-price control policy)とよぶ.
等価確定コントロール方策
上で述べた入札価格コントロール方策は,複数の最適双対変数が存在する可能性が高いことや, (旅程が複数の行程を含んでいる場合には基底が変化するので)双対変数の和が近似として不適当となる可能性がある. この弱点を克服するために,以下のように旅程 $j$ を受け入れた場合とそうでない場合の $2$通りの線形計画問題を解くことによって 旅程 $j$ の機会費用 $OC_j(n,t)$ を近似する方策が提案されている. $$ LP(n,E(D^{t-1}))-LP(n-A^j,E(D^{t-1})) $$
線形計画問題のかわりに確率的線形(整数)計画問題の最適値(もしくは近似値)を用いる方法も考えられる. これらの近似を用いた方策を総称して等価確定コントロール方策(certainty equivalent control policy)とよぶ.
より正確には,行程容量を表すベクトル $n$ と$t$期以降の需要量を表す確率変数 $D^t$ に対する数理計画モデルの最適値(もしくは近似値)を $MP(n,D^t)$ と記すとき, 等価確定コントロール方策とは,旅程 $j$ が発生したときに, $$ \begin{array}{l c l } R_j \geq MP(n,D^{t-1})-MP(n-A^j,D^{t-1}) & \Rightarrow & 受け入れ \\ それ以外 & \Rightarrow & 拒否 \end{array} $$
demand, revenue, a, capacity = make_sample_data_for_rm(5)
print("demand", demand)
print("revenue", revenue)
print("usage", a)
print("capacity", capacity)
days = 7 # 1 week
dem = [3,5,4,2] # demand
dem_weekend = [4,7,5,3] # weekend demand
rev = 2000
rev_weekend = 3000
average_stay = 2 # hours
start, finish = 6, 11 #start and finish time
demand, revenue, a = {}, {}, {}
demand_, revenue_, a_ = {}, {}, {}
# _ contains demand of (hour, day, start_hour)
for d in range(days):
for t in range(start, finish+1-average_stay):
if d<=4:
demand_[d,t] = dem[t-start]
revenue_[d,t] = rev
else: #week end
demand_[d,t] = dem_weekend[t-start]
revenue_[d,t] = rev_weekend
for tt in range(t,t+average_stay):
a_[tt,d,t] = 1
# convert to demand
slots = finish-start-average_stay + 1 # number of slots per day
for (ii,d,s) in a_:
i = d*slots+ii-start
j = d*slots+s-start
a[i,j] = 1
demand[j] = demand_[d,s]
revenue[j] = revenue_[d,s]
for i in range(slots*days+1):
capacity[i] = 7
reserve_demand_df = pd.read_csv(folder + "reserve_demand.csv",index_col=0)
reserve_demand_df.tail()
resource = list(set(reserve_demand_df.checkin)) #checkin date = resource (one resource)
resource.sort()
# checkin date and class => service => revenue and demand distribution
demand_history = {} # dictionary that maintains demand[checkin, leadtime, class]
for row in reserve_demand_df.itertuples():
tdelta = pd.to_datetime(row.checkin)- pd.to_datetime(row.reserve)
demand_history[row.checkin, tdelta.days, row.class_name] = row.demand
実データの読み込み
"Hotel booking demand datasets":https://www.sciencedirect.com/science/article/pii/S2352340918315191 2種類のデータ (H1=リゾートホテル, H2=シティホテル)
ADR Numeric Average Daily Rate as defined by [5] BO, BL and TR / Calculated by dividing the sum of all lodging transactions by the total number of staying nights Adults Integer Number of adults BO and BL Agent Categorical ID of the travel agency that made the bookinga BO and BL ArrivalDateDayOfMonth Integer Day of the month of the arrival date BO and BL ArrivalDateMonth Categorical Month of arrival date with 12 categories: “January” to “December” BO and BL ArrivalDateWeekNumber Integer Week number of the arrival date BO and BL ArrivalDateYear Integer Year of arrival date BO and BL AssignedRoomType Categorical Code for the type of room assigned to the booking. Sometimes the assigned room type differs from the reserved room type due to hotel operation reasons (e.g. overbooking) or by customer request. Code is presented instead of designation for anonymity reasons BO and BL Babies Integer Number of babies BO and BL BookingChanges Integer Number of changes/amendments made to the booking from the moment the booking was entered on the PMS until the moment of check-in or cancellation BO and BL/Calculated by adding the number of unique iterations that change some of the booking attributes, namely: persons, arrival date, nights, reserved room type or meal Children Integer Number of children BO and BL/Sum of both payable and non-payable children Company Categorical ID of the company/entity that made the booking or responsible for paying the booking. ID is presented instead of designation for anonymity reasons BO and BL. Country Categorical Country of origin. Categories are represented in the ISO 3155–3:2013 format [6] BO, BL and NT
CustomerType Categorical Type of booking, assuming one of four categories: BO and BL Contract - when the booking has an allotment or other type of contract associated to it; Group – when the booking is associated to a group; Transient – when the booking is not part of a group or contract, and is not associated to other transient booking; Transient-party – when the booking is transient, but is associated to at least other transient booking DaysInWaitingList Integer Number of days the booking was in the waiting list before it was confirmed to the customer BO/Calculated by subtracting the date the booking was confirmed to the customer from the date the booking entered on the PMS
DepositType Categorical Indication on if the customer made a deposit to guarantee the booking. This variable can assume three categories: BO and TR/Value calculated based on the payments identified for the booking in the transaction (TR) table before the booking׳s arrival or cancellation date. No Deposit – no deposit was made; In case no payments were found the value is “No Deposit”. If the payment was equal or exceeded the total cost of stay, the value is set as “Non Refund”. Non Refund – a deposit was made in the value of the total stay cost; Otherwise the value is set as “Refundable” Refundable – a deposit was made with a value under the total cost of stay. DistributionChannel Categorical Booking distribution channel. The term “TA” means “Travel Agents” and “TO” means “Tour Operators” BO, BL and DC IsCanceled Categorical Value indicating if the booking was canceled (1) or not (0) BO IsRepeatedGuest Categorical Value indicating if the booking name was from a repeated guest (1) or not (0) BO, BL and C/ Variable created by verifying if a profile was associated with the booking customer. If so, and if the customer profile creation date was prior to the creation date for the booking on the PMS database it was assumed the booking was from a repeated guest LeadTime Integer Number of days that elapsed between the entering date of the booking into the PMS and the arrival date BO and BL/ Subtraction of the entering date from the arrival date MarketSegment Categorical Market segment designation. In categories, the term “TA” means “Travel Agents” and “TO” means “Tour Operators” BO, BL and MS
Meal Categorical Type of meal booked. Categories are presented in standard hospitality meal packages: BO, BL and ML Undefined/SC – no meal package; BB – Bed & Breakfast; HB – Half board (breakfast and one other meal – usually dinner); FB – Full board (breakfast, lunch and dinner) PreviousBookingsNotCanceled Integer Number of previous bookings not cancelled by the customer prior to the current booking BO and BL / In case there was no customer profile associated with the booking, the value is set to 0. Otherwise, the value is the number of bookings with the same customer profile created before the current booking and not canceled. PreviousCancellations Integer Number of previous bookings that were cancelled by the customer prior to the current booking BO and BL/ In case there was no customer profile associated with the booking, the value is set to 0. Otherwise, the value is the number of bookings with the same customer profile created before the current booking and canceled. RequiredCardParkingSpaces Integer Number of car parking spaces required by the customer BO and BL
ReservationStatus Categorical Reservation last status, assuming one of three categories: BO Canceled – booking was canceled by the customer; Check-Out – customer has checked in but already departed; No-Show – customer did not check-in and did inform the hotel of the reason why ReservationStatusDate Date Date at which the last status was set. This variable can be used in conjunction with the ReservationStatus to understand when was the booking canceled or when did the customer checked-out of the hotel BO ReservedRoomType Categorical Code of room type reserved. Code is presented instead of designation for anonymity reasons BO and BL StaysInWeekendNights Integer Number of weekend nights (Saturday or Sunday) the guest stayed or booked to stay at the hotel BO and BL/ Calculated by counting the number of weekend nights from the total number of nights StaysInWeekNights Integer Number of week nights (Monday to Friday) the guest stayed or booked to stay at the hotel BO and BL/Calculated by counting the number of week nights from the total number of nights TotalOfSpecialRequests Integer Number of special requests made by the customer (e.g. twin bed or high floor) BO and BL/Sum of all special requests
h1_df = pd.read_csv(folder + "H1.csv")
h1_df.head().T
import datetime
date_list = []
for row in h1_df.itertuples():
date_ = str(row.ArrivalDateYear) + " " + row.ArrivalDateMonth + " "+ str(row.ArrivalDateDayOfMonth)
date = datetime.datetime.strptime(date_, "%Y %B %d")
date_list.append( date )
h1_df["Checkin"] = date_list
h1_df.head().T
#pd.pivot_table(h1_df,index="Checkin", columns= [ "LeadTime"],values=["ADR"])
#pd.pivot_table(h1_df,index="Checkin", columns= ["ReservedRoomType"],values="LeadTime")
start_date = pd.to_datetime(h1_df.Checkin.min())
print(start_date)
end_date = pd.to_datetime(h1_df.Checkin.max())
print(end_date)
max_period = (end_date-start_date).days + 1
print(max_period)
max_lt = h1_df.LeadTime.max()
print(max_lt)
X = np.zeros( (max_period,max_lt+1))
for row in h1_df.itertuples():
i = (row.Checkin - start_date).days
j = max_lt - row.LeadTime
#print(i,j)
X[i,j]+=1
for i in range(10): #max_period):
plt.plot(X[i].cumsum());
reservation = h1_df[ h1_df.Checkin == "2015-07-02 00:00:00" ]
max_lt = h1_df.LeadTime.max()
reservation.LeadTime.hist(bins=100)
y = np.zeros(max_lt+1)
for lt in reservation.LeadTime:
y[max_lt-lt]+=1
fig = px.line(x= range(max_lt+1), y= y.cumsum())
#plotly.offline.plot(fig);
h2_df = pd.read_csv(folder + "H2.csv")
h2_df.head().T
h1_df.describe().T
h2_df.describe().T
print(set(h1_df.ReservedRoomType))
h1_df.ADR.hist(bins=100);
h2_df.ADR.hist(bins=100);
h1_df.LeadTime.hist(bins=100);
h2_df.LeadTime.hist(bins=100);
h1_df.ADR.hist(bins=100);
class_df = pd.DataFrame({"class_name":["C","B","A"], "basic_demand": [20, 10, 5]})
start="2019/01/01"
periods = 60
current = 50
max_lt = 30 # reservation in starts max_lt before check-in day
cum_demand, ratio ={}, {}
for i,r in enumerate(resource):
cum_sum = 0
for lt in range(max_lt,-1,-1):
cum_sum += demand_history[r,lt,"A"]
cum_demand[r,lt,"A"] = cum_sum
#bid_price_control(demand, revenue, a, capacity, n_samples=100, method=0)
入れ子上限コントロール方策
数理計画モデル(線形計画モデルもしくは確率的線形計画モデル)を解くことによって, 各旅程に割り振られる座席数を決めることができる. 1行程の場合には,運賃が高いクラスを優先して座席数の上限を決定すれば良いが, ネットワーク型の問題に入れ子上限コントロール方策を適用するには,旅程の優先順序を決める必要がある.
数理計画モデルによって得た行程に対する双対変数を $v_i (i=1,\cdots,\ell)$ とする. このとき,旅程 $j$ に対する以下の指標 $$ \bar{R}_j = R_j - \sum_{j=1}^m a_{ij} v_i $$ の大きい順に優先して座席数の上限を入れ子になるように決める.
数理計画モデルによって得た最適解を $y^*_j (j=1,\cdots,m)$ とし, $\bar{R}_j$ が大きい順に $1,2,\cdots,m$ となるように旅程の番号を並べ替えてあるものとすると, 旅程 $j$ のために行程 $i$ に割り振られた(確保された)座席数の上限 $S_{ij}$ は, $$ S_{ij} = n_i- \sum_{k < j: a_{ik}=1} y^*_k $$ となる.これは,行程 $i$ を利用している $j$ よりも上位にランクされている旅程の確保分を除いた値が 旅程 $j$ 用に確保された行程 $i$ の座席数になることを意味している.
入れ子上限方策のシミュレーション nested_booking_limit_control
#nested_booking_limit_control(demand, revenue, a, capacity, n_samples=100, method=0)
予約の予測
$m \times n$ の2次元配列 $X$ に予約数が格納されているものとする.
行は宿泊日,列はリード時間(宿泊日の何日前に入れられたか)を表す.
列はリード時間の降順になっており,列 $0$はリード時間が$n$日前の予約,列 $n-1$が当日予約を表す.
行 $t$ が現在時点を表し,それより後の予約はまだ分かっていないため, $-1$ を入れておく.
過去の予約情報から,未来の予約数を予測することが目的となる.
最も簡単な方法は,過去の平均値で予測する方法でありる.
予約日が1日増すごとに予約数が前日までの累積予約数の何倍かになると仮定する乗法的モデルと,リード時間に依存した定数だけ増加する加法モデルの2つが考えられる.
以下では,乗法的モデルを考える.
m,n = 100, 15 # horizon,
X = poisson.rvs(5, size=(m,n))
t = 90 #current period (m-t < n)
for i in range(m):
for j in range(n):
if i-(n-1-j)>t:
X[i,j]= -1
X
C = X.cumsum(axis=1)
for i in range(m):
for j in range(n):
if i-(n-1-j)>t:
C[i,j]= -1
C
C_shift = np.roll(C,shift=-1,axis=1)
C_shift
ratio = C_shift/(C+0.001)
ratio = ratio[:t+1,:-1]
ratio
multi_ratio = ratio.mean(axis=0)
multi_ratio
for i in range(t+1,m):
for j in range(n-1-(i-t),n-1):
#print(i,j)
C[i,j+1] =C[i,j]*multi_ratio[j]
C
C.min()
プロスペクト理論を取り入れた価格戦略
実際には,顧客の需要は価格の単純な関数で表すことはできない. たとえば,あなたが買い物に行ったときに,昨日 $100$円で売られていた商品が, 今日は $120$円で売られていたらどうだろうか? 同じ商品が昨日まで $150$円で売られていたらどうだろうか? このように,買い物客は単に商品に貼られている値札だけでなく,商品の価値の基準をもっていて, その価値より安い場合には買いやすくなり,高い場合には買いにくくなる
ここでは,このような人間の心理まで取り入れた動的価格付けモデルを考える.鍵になるのは参照価格(reference price)の概念である.
参照価格とは消費者の基準となる商品の価格であり,これは(消費者が毎日同じスーパーに通っていると仮定して) 過去の価格と今日の価格から毎日更新されていく値である. ここでは, 第$t$期の参照価格 $R_t$ は,$t-1$期の価格 $P_{t-1}$ と参照価格 $R_{t-1}$ から, パラメータ $\alpha$ を用いて以下のように計算されるものと仮定する.
$$ R_t =(1-\alpha) P_{t-1}+ \alpha R_{t-1} $$パラメータ $\alpha$ が $0$ のとき,消費者はすぐに新しい価格を参照価格とし, $\alpha$ が $1$ のとき最初の参照価格を頑固に固持し,新しい価格に影響されないことになる.
数理最適化のモデル内では,参照価格も価格と同じく変数として扱う.
- $R_t$: 期$t$ における参照価格を表す変数.
参照価格に依存する需要の量は,価格 $P_t$ と参照価格 $R_t$ の関数 $\psi(P_t,R_t)$ で決まるものとする. 関数 $\psi(P_t,R_t)$ の形状は,商品や顧客の種類によって異なるが,以下では実験経済学の分野で妥当と考えられているモデルを紹介する.
価格が参照価格より高い場合には,人間の心理として購買する意欲が大きく減少し,逆に低い場合には購買意欲は多少増加する. たとえば,自分が想定している価格(いつも購入している商品の価格)より $10$円高い場合には,需要は大きく減少するが, $10$円安い場合には需要は多少増加するにとどまる.このような参照価格からのずれに対する需要の非対称性は, 多くの実験によって確認されている.この現象をロス回避(loss averse)とよぶ.
簡単のため線形関数を考え,参照価格より高い場合には,$\eta$ に比例して需要が減少し, 参照価格より安い場合には $\zeta$ に比例して需要が増加するものとする. いまロス回避の仮定から $0 \leq \zeta < \eta$ である. 上の仮定に基づく関数 $\psi(P_t,R_t)$ は以下のように定義できる.
$$ \psi(P_t,R_t) = \left\{ \begin{array}{l l } \zeta ( R_t -P_t) & R_t -P_t \geq 0 \ のとき \\ \eta ( P_t -R_t ) & それ以外のとき \end{array} \right. $$価格 $P_t$ のみに依存して決まる需要量を $\bar{D}_t$ とする. $$ \bar{D}_t= - a (P_t-p_0) +d_0 $$
実際の需要量 $D_t$ は上の $\bar{D}_t$ と参照価格による補正の和と定義する. $$ D_t = \bar{D}_t + \psi(P_t,R_t) $$
一方,$\eta = \zeta$ の場合をロス中立(loss neutral),$\eta < \zeta$ の場合をロス選好(loss seeking)と呼ぶ.
上では参照価格からの逸脱に対して線形関数の効用を仮定していたが,一般に人間の心理は非線形な挙動を示す. 線形でない場合の理論的な裏付けとして行動経済学におけるプロスペクト理論(prospect theory) を用いる
Prospect Theory: An Analysis of Decision under Risk by Daniel Kahneman and Amos Tversky Econometrica, 47(2), pp. 263-291, March 1979
行動経済学の先駆けとなったプロスペクト理論は,旧来の期待効用仮説に対して, より現実的な理論として1979年にDaniel KahnemanとAmos Tverskyによって提唱された. この成果によってKahnemanは2002年にノーベル経済学賞を受賞している.(Tverskyはすでに死去していたため受賞していない.)
この理論は,従来の効用関数では説明できない人間の心理を経済学的に把握するためのものであり, 以下の実験結果に基づく.
以下のうちどちらを選びますか? という質問に対しては多くの人が A を選択した.
- A: $100$万円が無条件で手に入る.
- B: 確率 $1/2$ で $200$万円が手に入り,確率 $1/2$ で何ももらえない.
以下のうちどちらを選びますか? という質問に対しては多くの人が B を選択した.
- A: 借金 $100$万円を支払う.
- B: 確率 $1/2$ で $200$万円を支払い,確率 $1/2$ で借金がチャラになる.
一般に,人間は目の前に利益があると,利益が手に入らないというリスクの回避を優先し, 損失を目の前にすると損失そのものを回避しようとする傾向があるのである. したがって,参照価格より高い場合には購入を控えるため,需要は線形よりも早い速度で減少し, 参照価格より低い場合にはすぐに購入するため,需要は線形より早い速度で増加する. (ただし,需要の参照価格からのずれに対する非対称性から,価格が低い場合の需要の増加量は,高い場合の減少量よりも小さい.)
また,実験結果から,利益がある場合には,$100$万円を無条件でもらえる場合の効用は, 確率 $1/2$ で $200$万円が手に入り,確率 $1/2$ で何ももらえない場合の期待効用以上であるので, 利益に対する需要曲線は凹関数であることが分かる. 逆に,損失に対する需要曲線は, $100$万円を無条件で支払う場合の効用は, 確率 $1/2$ で $200$万円を支払い,確率 $1/2$ で何も払わない場合の期待効用以下であるので,凸関数であることが分かる
上の観察に基づき,関数 $\psi(P_t,R_t)$ を,パラメータ $\zeta,\eta$ と $0 < \beta, \gamma < 1$ を用いて, 以下のように定義する. $$ \psi(P_t,R_t) = \left\{ \begin{array}{l l } \zeta ( R_t -P_t )^\beta & R_t -P_t \geq 0 \ のとき \\ \eta (P_t -R_t)^\gamma & それ以外のとき \end{array} \right. $$
この場合の収益曲線は(参照価格を固定しても)凹関数ではない.
このように利益を得る領域($R_t > P_t$)では凸関数,損出を被る領域($P_t > R_t$)では凹関数になる効用関数はリスク回避(risk aversion)と呼ばれる.
需要曲線(上図)と収益曲線(下図)を示しておく.
この結果から以下の知見が得られる.
従来の研究では,固定価格方策が最適であると言われていたが, 価格を一時的に上昇させ,徐々に下げていく方策の方がより高い収益を上げる場合がある. これは価格を急激に高く設定することによって参照価格を上げ,その後価格を下げた後に徐々に価格を下げていくことによって 線形の場合より多くの需要を獲得することを意味する.ロスの領域(価格が参照価格より高い領域) における需要関数の凸性から,価格は徐々に上げるのではなく 一度に急激に上げた方が需要の減少は少ない.また,利益の領域(価格が参照価格より低い領域)における需要関数の凹性から, 価格は徐々に下げた方が需要の上昇が大きくなる.これをプロスペクト効果と名付ける.
$\beta,\gamma$ が小さい(凸性,凹性が大きい)ほど価格変更の周期が小さくなり,振幅が大きくなる.
- $\alpha$ が小さいと参照価格の追従速度が速いので,価格変更の周期が小さくなる.
- $\beta,\gamma$ が $1$ に近づくと固定価格方策が最適になる.これは従来の解析的モデルの結果と一致する.