米田氏が企画した「競プロ典型90問」を解いていきます。
ここでは私の試行錯誤やら解説の理解やら気づきやらをメモしていこうと思います。
競プロ初心者なのでどうか温かい目で見守ってください。
なお、本記事中のPythonコードはブラウザ上で実行可能です。
よろしければ遊んでいってください。
問題
006 - Smallest Subsequence(★5)
kyopro_educational_90/006.jpg at main · E869120/kyopro_educational_90
やってみよう!
テストデータ・テスト関数定義 ↓
# 縮小表示
test_data = [
{
"in":[7, 3, 'atcoder'],
"out": "acd"
},{
"in":[14, 5, 'kittyonyourlap'],
"out": "inlap"
}
]
def test_all(f):
for i, data in enumerate(test_data):
exp = data["out"]
ans = f(*data["in"])
result = "AC" if exp == ans else "WA"
print(f"{i+1} {result}: expected: {exp}, output: {ans}")
下のmain0
関数を完成させて「Run」ボタンをクリックしよう!
def main0(N, K, S):
pass
test_all(main0)
自由欄
try(1st.)
愚直に解いてみます。
def main(N, K, S):
# index:1~Kにansを作る文字のNでのインデックスを格納する
idx = [-1]
for k in range(1, K+1):
char = "~"
for i in range(idx[k-1] + 1, N - (K-k)):
if S[i] < char:
char = S[i]
w_i = i
idx.append(w_i)
return "".join([S[i] for i in idx[1:]])
test_all(main);
結果
一個だけTLE…!
提出 #32635326 - 競プロ典型 90 問
try(2nd.)
速度改善に資するかは微妙ですが、内側のループの代わりにmin
とindex
で次の文字を探してみます。
def main(N, K, S):
# index:1~Kにansを作る文字のNでのインデックスを格納する
idx = [-1]
chars = list()
for k in range(1, K+1):
begin = idx[k-1] + 1
end = N - (K-k)
char = min(S[begin:end])
i = S.index(char, begin, end)
chars.append(char)
idx.append(i)
return "".join(chars)
test_all(main);
結果
お、AC!やったー
提出 #32651671 - 競プロ典型 90 問
解説・想定コード
一応、解説も見てみます。
すると先程の達成感もつかの間、私の実装では本来TLEとのこと…。とほほ。
kyopro_educational_90/006.jpg at main · E869120/kyopro_educational_90
想定コード
kyopro_educational_90/006.cpp at main · E869120/kyopro_educational_90
ちょっと解説が何言ってるのか分からないのでコードを見ます。
Pythonで書き換えたのが以下。
def main(N, K, S):
'''想定コード(下記URL)参照
https://github.com/E869120/kyopro_educational_90/blob/main/sol/006.cpp
'''
# 前処理
nex = [[N]*26]
for i in range(N-1, -1, -1):
a = nex[-1].copy()
a[ord(S[i])-ord("a")] = i
nex.append(a)
nex = nex[::-1]
# 一文字ずつ貪欲に決める
ans = []
curr_pos = 0
for i in range(K):
for j in range(26):
nex_pos = nex[curr_pos][j]
if N - nex_pos >= K-i:
ans.append(j)
curr_pos = nex_pos + 1
break
return "".join([chr(ord("a")+c) for c in ans])
test_all(main)
結果
提出 #32641757 - 競プロ典型 90 問
は、早い!
上の自力コードでは最大1005msだったものが、120msにまで短縮されました!!
解説の理解
コード全体を見るとようやく理解できました。これ思いつく人、天才かよ。
というより、どうやら頻出のパターンのようです。
この配列は極めて汎用性が高いので、実にさまざまな問題で活用できます!!!
いっそライブラリ化しても良いように思います。
競プロ典型 90 問 006 - Smallest Subsequence(★5) - けんちょんの競プロ精進記録
とは言え、初見ではなかなか分かりづらいので、以下順を追ってみていきます。
各index以降で各文字が最初に登場するindexを格納する配列
やはり言葉だとなんのこっちゃ、となりますので例のkittyonyourlap
で確認します。
N, K, S = test_data[1]["in"]
N, K, S
nex = [[N]*26]
for i in range(N-1, -1, -1):
a = nex[-1].copy()
a[ord(S[i])-ord("a")] = i
nex.append(a)
nex = nex[::-1]
nex
配列を見てみましょう。
# 縮小表示
import string
import pandas as pd
pd.options.display.max_columns = 30
import jinja2 # DataFrame.styleを扱うのに必要。pyodideでは明示的にimportしなければならない
df = pd.DataFrame(
nex, index=[f'S[{i:}]: {c}' for i, c in enumerate(S)]+[""],
columns=list(string.ascii_lowercase))
df.style.set_table_attributes('class="dataframe"').set_td_classes(pd.DataFrame(
[[None]*i+["updated"]+[None]*(25-i) for i in [ord(c)-ord("a") for c in S]]+[[None]*26], index=df.index, columns=df.columns)
).set_table_styles(
[{
'selector': '.updated',
'props': [
('color', 'red'),
('font-weight', 'bold')
]
}]
)
最終的にnex
のサイズはN+1
になりますが、nex[N]
は作成時(の最初の1回)のみ参照されます。
S
の後ろから見て、nex
の下の行から埋めていきます。
S[13]: p
なので、nex[13]
のp
の位置(13)に13を入れます(偶然S
のインデックスと文字のインデックスが一致して分かりづらいです)。他の値はnex[14]
と同じです。
続けてS[12]
を見るとa
なので、nex[12]
のa
の位置(0)に12を入れます。
・・・ということを繰り返すと、『各index以降で各文字が最初に登場するindexを格納する配列』が出来上がります。
貪欲法
今回の場合では辞書順に(アルファベットの"a"から)探索し、条件を満たせば採用する点が貪欲法なんでしょう。
そして条件というのが、「その文字($S_i$)を採用した場合、$S_{i+1}$文字目以降で最終的に長さ$K$の文字列を作れるか」ということになります。
コードに沿って考えてみます。
ans = []
curr_pos = 0
まずnex[0]
を見ます。この時点ではまだ文字を選んでいないので、採用できる文字の$S$におけるインデックスは9以下となります。
nex[0]
を右から(辞書順に)探索して初めて9以下になるのは"i"なので採用します。
# for i in range(K):
i = 0
for j in range(26):
nex_pos = nex[curr_pos][j]
if N - nex_pos >= K-i:
ans.append(j)
curr_pos = nex_pos + 1
break
"".join([chr(ord("a")+c) for c in ans])
次に、"i"のインデックスを一つ進めたnex[2]
を探索し、10以下になるものを探します。
$S[6]$で"n"を見つけたので採用します。
# for i in range(K):
i = 1
for j in range(26):
nex_pos = nex[curr_pos][j]
if N - nex_pos >= K-i:
ans.append(j)
curr_pos = nex_pos + 1
break
"".join([chr(ord("a")+c) for c in ans])
今度はnex[7]
で11以下になるものを探索し・・・ということをK回繰り返せば答えが得られるというわけです。
for i in range(2, K):
for j in range(26):
nex_pos = nex[curr_pos][j]
if N - nex_pos >= K-i:
ans.append(j)
curr_pos = nex_pos + 1
break
"".join([chr(ord("a")+c) for c in ans])
まとめ
今更ながら、アルゴリズム、奥が深い。
今回の解法って一般化して活用することはできるんだろうか?🤔
自由欄