式 - Haskell2010 Language Report 日本語訳

この章では、私たちはHaskellの式の構文と非形式的な意味論を説明する。また必要であらばHaskellカーネルへの変換についても説明する。let式の場合を除いて、これらの変換は静的、動的な意味論の両方を保存する。これらの変換を使った束縛されていない変数とコンストラクタは常にPreludeによって定義された実体を参照する。例えば、リスト内包表記の変換(セクション[3.11])で使われる"concatMap"はPreludeによって定義されたconcatMapを意味する。これは識別子"concatMap"がリスト内包表記で使われているスコープ内にあるかないかは関係なく、また、(もしスコープ内にあったとしても)束縛されていても関係はない。

exp	→	infixexp :: [context =>] type	(expression type signature)
	\|	infixexp	(expression type signature)

infixexp	→	lexp qop infixexp	(infix operator application)
	\|	- infixexp	(prefix negation)
	\|	lexp

lexp	→	\ apat₁ … apat_n -> exp	(lambda abstraction, n ≥ 1)
	\|	`let` decls `in` exp	(let expression)
	\|	`if` exp [;] `then` exp [;] `else` exp	(conditional)
	\|	`case` exp of { alts }	(case expression)
	\|	`do` { stmts }	(do expression)
	\|	fexp

fexp	→	[fexp] aexp	(function application)

aexp	→	qvar	(variable)
	\|	gcon	(general constructor)
	\|	literal
	\|	( exp )	(parenthesized expression)
	\|	( exp₁ , … , exp_k )	(tuple, k ≥ 2)
	\|	[ exp₁ , … , exp_k ]	(list, k ≥ 1)
	\|	[ exp₁ [, exp₂] .. [exp₃] ]	(arithmetic sequence)
	\|	[ exp \| qual₁ , … , qual_n ]	(list comprehension, n ≥ 1)
	\|	( infixexp qop )	(left section)
	\|	( qop_⟨-⟩ infixexp )	(right section)
	\|	qcon { fbind₁ , … , fbind_n }	(labeled construction, n ≥ 0)
	\|	aexp_⟨qcon⟩ { fbind₁ , … , fbind_n }	(labeled update, n ≥ 1)

中置演算子を含む式は演算子の結合性によって曖昧さを排除されている(セクション4.4.2参照)。同じ優先度をもつ連続した括弧を持たない演算子は構文エラーを避けるためにどちらも左または右のどちらかに結合しなければならない。括弧を持たない式"x qop^(a,i) y qop^(b,j) z" ( qop^(a,i)はaと優先順位iに関連付いた演算子を意味する)が与えられた場合、括弧はi = jでかつa = b = lかa = b = rでない時は、"x qop^(a,i) y"か"y qop^(b,i) z"のどちらかを囲むよう追加されなければいけない。

中置演算子を含む式の解決するためのアルゴリズムの例はセクション10.6にある。

符号反転演算子はHaskellにおいて唯一の接頭語になる。中置と同じ優先順位を持ち、演算子はPreludeの中に定義されている(セクション4.4.2, 図4.1)。

この文法は条件式、let式、ラムダ抽象の拡張については曖昧だ。その曖昧さは各構成ができるだけ右へ拡張されるメタ規則により解決される。

構文解析の例を以下に示す。

これが	このように解析される
f x + g y	(f x) + (g y)
- f x + y	(- (f x)) + y
let { ... } in x + y	let { ... } in (x + y)
z + let { ... } in x + y	z + (let { ... } in (x + y))
f x y :: Int	(f x y) :: Int
\ x -> a+b :: Int	\ x -> ((a+b) :: Int)

わかりやすくするため、以後このセクションでは中置演算子を含む式が演算子の結合性に従って解決されているということにする。

式の評価中のエラーは、⊥("bottom")と表記されるが、停止しないことからHaskellプログラムには区別できない。Haskellは非正格評価の言語なことから、全てのHaskellの型は⊥を含む。つまり、いかなる型の値もユーザーが望めばエラーを返す計算になる可能性がある。評価されたときエラーは直ちにプログラムを停止させ、ユーザーが捕捉されることはできない。Preludeは直接そのようなエラーを引き起こす二つの関数を提供している。

error     :: String -> a
undefined :: a

errorの呼び出しはプログラムの実行を終了させ、OSに適切なエラー表示を返す。そのエラー表示にはシステム依存の方法で文字列を画面に表示するべきである。undefinedが使われたとき、そのエラーメッセージはコンパイラーによって作成される。

Haskellの式の変換は実行時エラーが発生したことを明示的に表示するためerrorとundefinedを使用する。エラーが発生した際の実際のプログラムの振舞は実装次第である。そのメッセージはこれらの変換のみ提案するためerror関数へ渡される。エラー発生時、詳しい情報または乏しい情報を表示することを実装側は選択するかもしれない。

aexp	→	qvar	(variable)
	\|	gcon	(general constructor)
	\|	literal

gcon	→	()
	\|	[]
	\|	(,{,})
	\|	qcon

var	→	varid \| ( varsym )	(variable)
qvar	→	qvarid \| ( qvarsym )	(qualified variable)
con	→	conid \| ( consym )	(constructor)
qcon	→	qconid \| ( gconsym )	(qualified constructor)
varop	→	varsym \| ` varid `	(variable operator)
qvarop	→	qvarsym \| ` qvarid `	(qualified variable operator)
conop	→	consym \| ` conid `	(constructor operator)
qconop	→	gconsym \| ` qconid `	(qualified constructor operator)
op	→	varop \| conop	(operator)
qop	→	qvarop \| qconop	(qualified operator)
gconsym	→	: \| qconsym

Haskellは中置記法に対応するため特別な構文を提供している。 演算子 は中置構文を用いて適用が可能である(セクション3.4)か、 セクション (セクション3.5)を用いて部分的に適用が可能な関数のことである。

演算子 は、+や$$といった 演算子シンボル か、` op `のようにグレイブ・アクセント(バッククォート)で囲まれた通常の識別子かのいずれかである。例えば、op x yという前置適用を書く代わりに、x `op` yという中置適用を書くことができる。もし、` op `に対して結合性が宣言されていない場合には、優先順位は最高で左結合をデフォルトとする。(セクション4.4.2参照)。

対照的に、演算子シンボルは括弧で閉じられた普通の識別子へ変換可能である。例として、(+) x yはx + yに等しく、foldr (⋆) 1 xsはfoldr (\x y -> x⋆y) 1 xsに等しくなる。

一部の組み込み型のコンストラクタの名前をつけるのに特別な構文がつかわれているものがあり、実際にgconやliteralで見ることができる。これらについてはセクション6.1で説明される。

整数リテラルはfromInteger関数をInteger型の適した値への適用を表す。同様に、浮動小数点リテラルはRational型(つまり、Ratio Integer)の値にfromRationalを適用することを表す。

変換: 整数リテラルiはfromInteger iに等しく、fromIntegerはNumクラスのメソッドである。(セクション6.4.1)

浮動小数点リテラルfはfromRational (n Ratio.% d)に等しく、fromRationalはFractionalクラスのメソッドで、Ratio.%はRatioライブラリで定義されており、2つの整数から有理数を構築する。整数nとdはn/d = fを満たすものとして選ばれる。

fexp	→	[fexp] aexp	(function application)
lexp	→	\ apat₁ … apat_n -> exp	(lambda abstraction, n ≥ 1)

関数適用はe₁ e₂と書く。適用は左結合性をもつので、(f x) yの括弧は省略することができる。e₁はデータ構成子である可能性もあるため、データ構成子の部分的な適用は許されている。

ラムダ抽象 は\ p₁ … p_n -> eと書き、p_iはパターンである。\x:xs->xのような式は構文的に正しくない。(x:xs)->xと書くのが正しい。

パターンの集合は線形でなければならない。つまり、変数は集合の中で2回以上出現してはいけない。

変換: 以下の等式が成り立つ。

p₁ … p_n -> e = \ X₁ … X_n -> case (X₁, …, X_n) of (p₁, …, p_n) -> e

X_iは新しい識別子である。

この変換がセクション3.17.3で説明するcase式とパターンマッチの意味論と組み合わさって与えられたとき、もしもパターンマッチに失敗すれば結果は⊥となる。

infixexp	→	lexp qop infixexp
	\|	- infixexp	(prefix negation)
	\|	lexp
qop	→	qvarop \| qconop	(qualified operator)

e₁ qop e₂という形式は二項演算子qopの式e₁とe₂への中置適用である。

特殊な形式-eは前置の符号反転演算子を表す。この演算子はHaskellにおける唯一の前置演算子であり、negate (e)という意味の構文である。二項演算子-はPrelude内の-の定義への参照を必要とせず、モジュールシステムによって再束縛されるかもしれない。しかしながら、単項演算子-はPrelude内で定義されたnegate関数を常に参照する。-演算子の局所的な意味と単項の符号反転演算との間には何の関連もない。

前置の符号反転演算子はPrelude内(表4.1を参照)で定義された中置演算子-と同じ優先順位を持つ。e1-e2は二項演算子-の中置表現解析されるため、前置の符号反転演算子を使うには構文解析に代わってe1(-e2)と書かなければいけない。同様に、(-)は中置演算子と同様に(\ x y -> x-y)のための構文であるが、(\ x -> -x)を表せず、そのためにはnegateを使う必要がある。

変換： 以下の等式が成り立つ。

e₁ op e₂  =	(op) e₁ e₂
-e        =	negate (e)

aexp	→	( infixexp qop )	(left section)
	\|	( qop_⟨-⟩ infixexp )	(right section)

セクション は( op e )や( e op )のように書かれる。このときのopは二項演算子でeは式である。セクションは二項演算子を部分的に適用する便利な構文である。

シンタックスの先行ルールは次のとおりのセクションへ適用する。(op e)は(x op e)が(x op (e))と同じ方法でパースする場合に限り正当であり、(e op)も同様である。例えば、(⋆a+b)は構文的に不当であるが、(+a⋆b)と(⋆(a+b))は有効である。なぜなら(+)は左結合であり、(a+b+)は構文的に正しいが、(+a+b)はそうではない。後者は(+(a+b))のように書かれるのが正当である。他の例として、次の式は

(let n = 10 in n +)

セクション3にあるように、let/ラムダに関するメタルールにより誤りである。次の式は

(let n = 10 in n + x)

以下のように解析され

(let n = 10 in (n + x))

次のようにはならない

((let n = 10 in n) + x)

なぜなら、-は文法内で特別に扱われるからだ。前のセクションで説明したように、(- exp)はセクションではなく、前置の符号反転演算子の適用である。しかしながら、Prelude名で定義されたsubtract関数があり、それによって(subtract exp)が不正なセクション(訳注: (- exp)のこと)と同じ意味となる。式(+ (- exp))は同じ用途で役立つことができる。

変換: 以下の等式が成り立つ。

(op e)  =       \ x -> x op e
(e op)  =       \ X -> e op x

opは二項演算子で、eは式であり、xはeの中で自由出現ではない変数である。

lexp	→	`if` exp [;] `then` exp [;] `else` exp

条件式はif e₁ then e₂ else e₃の形式をとり、もしe₁がTrueなら、e₂を返し、e₁がFalseならe₃を返し、それ以外なら⊥を返す。

変換: 以下の等式が成り立つ。

if e₁ then e₂ else e₃(op e) = case e₁ of { True -> e₂ ; False -> e₃ }

TrueとFalseはPrelude内で定義されているBool型の2つの引数のないコンストラクタである。e₁はBool型でなければならず、e₂とe₃も同じ型でなければならない。条件式全体の型も同様である。

infixexp	→	exp₁ qop exp₂
aexp	→	[ exp₁ , … , exp_k ]	(k ≥ 1)
	\|	gcon
gcon	→	`[]`
	\|	qcon
qcon	→	( gconsym )
qop	→	qconop
qconop	→	gconsym
gconsym	→	`:`

List はk ≥ 1として、[e₁, …, e_k]のように書く。リストコンストラクタは :であり、空リストは[]で表記される。リストの標準操作はPrelude内で与えられる(セクション6.1.3と9章の特にセクション9.1を参照)。

変換: 以下の等式が成り立つ。

[e₁, …, e_k] = e₁ : (e₂ : ( … (e_k : [])))

:と[]はPredule内(セクション6.1.3)で定義されたリストのコンストラクタである。e₁からe_kまでの型は同じでなければならない(それをtと呼ぶ)。式全体の型は[t]になる(セクション4.1.2)。

コンストラクタ":"は[]のようにリストコンストラクタとしてのみ予約されており、言語構文の一部と見做されている。また、それは隠すことも再定義することもできない。:は優先順位レベル5の右結合演算子である(セクション4.4.2)。

aexp	→	( exp₁ , … , exp_k )	(k ≥ 2)
	\|	qcon
qcon	→	(,{,})

タプル はk ≥ 2以上の(e₁, …, e_k)のように書く。n-tupleのコンストラクタは(,…,)と表記され、n - 1のコンマがある。従って、(a,b,c)と(,,) a b cは同じ値を表す。タプルの標準操作はPrelude内で定義されている(セクション6.1.4と9章)。

変換: k ≥ 2のときの(e₁, …, e_k)はPrelude内で定義されたk-tupleのインスタンスになり、変換は要求されない。もし、t₁からt_kはそれぞれe₁からe_kの型があり、最終的なタプルの型は(t₁,…,t_k)になる(セクション4.1.2)。

aexp	→	gcon
	\|	`(` exp `)`
gcon	→	`()`

(e)の形式はシンプルに 括弧付き式 であり、eと等しい。ユニット(unit)式()は()型を持つ(セクション4.1.2を参照)。それは⊥以外の型のメンバのみで、"引数のないタプル"のように考えられる(セクション6.1.5を参照)。

変換: (e)はeと等しい。

aexp	→	`[` exp₁ `[`, exp₂`]` .. `[`exp₃`]` `]`

数列 [e₁,e₂ .. e₃]は型tの値のリストを表し、各e_iは型tを持ち、tはEnumクラスのインスタンスである。

変換: 数列はこれらの等式を満たす。

[ e₁.. ]	=	`enumFrom` e₁
[ e₁,e₂.. ]	=	`enumFromThen` e₁ e₂
[ e₁..e₃ ]	=	`enumFromTo` e₁ e₃
[ e₁,e₂..e₃ ]	=	`enumFromThenTo` e₁ e₂ e₃

enumForm、enumFormThen、enumFormTo、enumFormThenToはPrelude内で定義されているEnumクラスのクラスメソッドになる。

故に数列の意味論は型tのインスタンス宣言に完全に依存している。どのPrelude型がEnum型にあるか、そしてそれらの意味論についてのより詳しいことについてはセクション6.3.4を参照すること。

aexp	→	[ exp \| qual₁ , … , qual_n ]	(list comprehension, n ≥ 1)
qual	→	pat <- exp	(generator)
	\|	`let` decls	(local declaration)
	\|	exp	(boolean guard)

リスト内包表記 は[ e | q₁, …, q_n ]、n ≥ 1形式を持ち、q_i修飾子は次のいずれかである。

形式p <- eの ジェネレータ 。pは型tのパターン(セクション3.17)であり、eは型[t]の式である。
生成された式eで、あるいは後方のブーリアンガードとジェネレータで使われる新しい定義を提供する ローカル束縛 。
ブーリアンガード 。Bool型の任意の式を表すことができる。

このようなリスト内包表記は修飾子リスト内のジェネレータのネストされた深さ優先探索の評価によって作成された連続した環境でeを評価することによって生成された要素のリストを返す。変数の束縛は通常のパターンマッチングルール(セクション3.17)に従って発生し、もし一致に失敗したら、その時はそのリストの要素は単純にスキップされる。従って、

[ x |  xs   <- [ [(1,2),(3,4)], [(5,4),(3,2)] ],  
      (3,x) <- xs ]

リスト[4,2]を返す。もし修飾子がブーリアンガードなら、成功した前のパターンマッチのためにTrueと評価しなけれないけない。通常通り、リスト内法表記における束縛は外部スコープの束縛をシャドーイングできる。例えば以下のようになる。

[ x | x <- x, x <- x ] = [ z | y <- x, z <- y]

変換: リスト内包表記はこれらの等式を満たし、これらの等式はカーネルへの変換として使われる可能性がある。

[ e \| `True` ]	=	[e]
[ e \| q ]	=	[ e \| q, `True` ]
[ e \| b, Q ]	=	`if` b `then` [ e \| Q ] `else` []
[ e \| p <- l, Q ]	=	`let` `ok` p = [ e \| Q ]
		`ok` _ = []
		`in` `concatMap` `ok` l
[ e \| `let` decls, Q ]	=	`let` decls `in` [ e \| Q ]

eは式にわたる範囲で、pはパターンにわたり、lはリスト値式にわたり、bはブーリアン式にわたり、decls は宣言リストにわたり、qは修飾子にわたり、Qは修飾子の列にわたる範囲をもつ。okは新しい変数である。関数concatMapとブーリアン値TrueはPrelude内で定義されている。

リスト内法表記の変換で示した通り、letによって束縛された変数は最大限多相的な型を持つ一方で<-によって束縛されたものはラムダ束縛であり、よって単相的になる。 (セクション4.5.4を参照).

lexp	→	`let` decls `in` exp

let 式は一般的な形式let { d₁ ; … ; d_n } in eを持ち、ネストされたレキシカルスコープをもつ相互再帰的な宣言のリストを導入する(letは他の言語でletrcとしばしば呼ばれる)。宣言の範囲は式eと宣言の右側である。宣言は4章で説明される。パターン束縛のマッチは遅延され、暗黙的な~がこれらのパターンを反駁不可にする。例えば、

let (x,y) = undefined in e

はxまたはyが評価されるまでランタイムエラーをもたらさない。

変換: 式let { d₁ ; … ; d_n} in e₀の動的な意味論は次の変換によって捕捉される。全ての型シグネチャを取り除いた後、それぞれの宣言d_iはp_i = e_iの形の等式へと変換される。p_iとe_iはセクション4.4.3での変換を使用する、各々のパターンと式である。一度この変換が終われば、次のような等式が成り立つ。この等式はカーネルへの変換として使われる場合がある。

`let` {p₁ = e₁; ... ; p_n = e_n} `in` e₀	=	`let` (`~`p₁, ... ,`~`p_n) = (e₁, ... ,e_n) in e₀
`let` p = e₁ `in` e₀	=	`case` e₁ of `~`p -> e₀
		where no variable in p appears free in e₁
`let` p = e₁ `in` e₀	=	`let` p = `fix` ( \ `~`p -> e₁) in e₀

fixは最小不動点演算子である。反駁不可パターン~pの使用は注意すべきだ。この変換は静的な意味論を保存しない。なぜなら、caseを使用すると束縛変数が完全な多相型へ型付けされなくなるからである。let式で束縛された静的な意味論はセクション4.4.3で説明される。

lexp	→	`case` exp `of` { alts }
alts	→	alt₁ ; … ; alt_n	(n ≥ 1)
alt	→	pat -> exp [`where` decls]
	\|	pat gdpat [`where` decls]
	\|		(empty alternative)
gdpat	→	guards -> exp [ gdpat ]
guards	→	`\|` guard₁, …, guard_n	(n ≥ 1)
guard	→	pat <- infixexp	(pattern guard)
	\|	`let` decls	(local declaration)
	\|	infixexp	(boolean guard)

case 式は一般的な形式case e of { p₁ match₁ ; … ; p_n match_n }を持つ。各match_iは一般的な形式

| gs_i1    -> e_i1
…
| gs_imi   -> e_imi
where decls_i

( ガード の構文ルールについて注目して欲しい。|は区切りを表す構文的なメタシンボルではなく終端記号である。)各選択子p_i match_iはパターンp_iから成り、match_iと一致する。各マッチは順繰りにガードgs_ijと本体e_ijのペアの列から成り、代替となる全てのガードと式上の範囲での付加的な束縛(decls_i)に従う。

ガード は次の形式をの一つを持つ。

パターンガード は形式p <- eで、pは型tのパターンで、eは式の種類tである。もし、式eがパターンpに一致するなら成功し、パターンの束縛をその環境にもたらす。
局地的束縛 は形式let declsである。それらは常に成功し、その環境にdeclsと定義した名前をもたらす。
ブーリアンガード はBool型の数式である。もし、式がTrueと評価するなら成功し、その環境に新しい名前をもたらさない。ブーリアンガードgはパターンガードTrue <- gに意味的に等しい。

形式pat -> exp where declsの代わりの以下の簡略記法が扱われる。

pat | True -> exp
where decls

ケース式は少なくとも1つの選択句を持たなければならず、各選択句は一つの実体を持たないといけない。各実体は同じ型を持たなければならず、式全体の型はその型になる。

ケース式は式eが個々の選択句に反するパターンマッチングによって評価される。その選択子は上から下へ連続的に試される。もし、eが選択句のパターンと一致したら、そのとき選択句のガード式は始めにパターンの一致の間に生成された束縛によって展開されたケース式の環境内で上から下へ連続的に試される。その時、where句内のdecls_iによって、その選択句は関連付けられる。

各ガード式のためにコンマ区切りのガードは左から右へ連続的に試される。もしそのすべてに成功したなら、そのときは対応する式はガードによって生成された束縛で展開された環境で評価される。すなわち、(let句かパターンガードのいずれかを使った)ガードによって生成された束縛は続くガードと対応する式のスコープ内にある。もしあらゆるガードが失敗したら、その時はこのガード式は失敗し次のガード式を試す。

もし与えられた選択句のどのガード式も成功しなかったら、その時マッチングは次の選択句へ継続する。もしどの選択句も成功しなければ、そのときの結果は⊥となる。パターンマッチングはセクション3.17で説明され、ケース式の正式な意味論はセクション3.17.3で説明される。

パースについての注意点 。以下の式は

case x of { (a,_) | let b = not a in b :: Bool -> a }

これを正しく構文解析するには用心しなければならない。ただ一つの曖昧さのない構文解析は、すなわち次のようにすることである。

case x of { (a,_) | (let b = not a in b :: Bool) -> a }

しかしながら、Bool -> aというフレーズは型として構文的に正当であり、先読みが制限されているパーサーはこの選択に誤ってコミットする可能性があり、それゆえプログラムは拒否する。故に、プログラマーは型シグネチャで終わるガードを避けるように勧められる。これは実際に ガード がexpではなくinfixexpを含んでいる理由になる。

lexp	→	`do` { stmts }	(do expression)
stmts	→	stmt₁ … stmt_n exp [`;`]	(n ≥ 0)
stmt	→	exp ;
	\|	pat <- exp ;
	\|	`let` decls ;
	\|	`;`	(empty statement)

do式はモナドのプログラミングのためのより従来的な構文を提供する。それは以下のような式を許す。

putStr "x: "    >>  
getLine         >>= \l ->  
return (words l)

より、旧来の方法による書き方は次のものになる。

do putStr "x: "  
   l <- getLine  
   return (words l)

変換： Do式はこれらの等式を満たし、排除した空のstmtsの後にカーネルの中への変換のように使われるかもしれない。

`do` {e}	=	e
`do` {e;stmts}	=	e >> `do` {stmts}
`do` {p <- e; stmts}	=	`let` `ok` p = `do` {stmts}
		`ok` _ = `fail` "..."
		`in` e >>= `ok`
`do` {`let` decls; stmts}	=	`let` decls `in` `do` {stmts}

コンパイラが生成したエラーメッセージを表す省略記号"..."の部分はfailへ渡され、そして可能であればパターンマッチに失敗した場所を表示する。関数>>,>>=とfailはPreludeで定義されたクラスMonadの操作であり、okは新しい識別子である。

doの変換でも示したように、letに束縛された変数は完全に多相的な型をもつ一方で<-によって定義された変数はラムダ束縛であり、ゆえに単相的である。

データ型の宣言はフィールドラベルを必要に応じて定義してもよい。(セクション4.2.1を参照)これらのフィールドラベルは構築、形式の選択、データ型全体の構造に依存した方法でのフィールドの更新することに使用される。

異なるデータ型は同じスコープの共通のフィールドラベルを共有することはできない。フィールドラベルはコンストラクタ内で高々一度だけ、使用することができる。しかしながら、データ型の中で、あるフィールドがすべてのコンストラクタ内で同じ型を持つときに限り1つのフィールドを複数のコンストラクタで使用することができる。最後の点については次が良い例である:

data S = S1 { x :: Int } | S2 { x :: Int }   -- OK  
data T = T1 { y :: Int } | T2 { y :: Bool }  -- BAD

ここでのsは正当であるがTはそうではない。またyは後者では矛盾する型付けが与えられている。

aexp	→	qvar

フィールドラベルはセレクタ関数のように使用される。変数のように使われる際は、フィールドラベルはオブジェクトからフィールドを抽出する関数のように振る舞う。セレクタはトップレベルの束縛であり、よってローカル変数によってシャドーイングされる場合があるが、しかし他のトップレベルの束縛で同じ名前のものと衝突してはならない。この覆いはセレクタ関数にのみ影響を及ぼし、レコード作成(セクション3.15.2)及びに更新(セクション3.15.3)、フィールドラベルは通常の変数と混合されることはない。

変換: フィールドラベルfは次のようなセレクタ関数を生成する。

f x	=	`case` x `of` { C₁ p₁₁ … p_1k -> e₁ ;… ; C_n p_n1 … p_nk -> e_n }

C₁ ... C_nは全てfとラベルされたフィールドを含むデータ型のコンストラクタで、p_ijはfがC_iの要素のj番目、または_をラベルした時のyであり、e_iはC_iのフィールドがfまたはundefinedのラベルを持つ時のyである。

aexp	→	qcon { fbind₁ , … , fbind_n }	(labeled construction, n ≥ 0)
fbind	→	qvar = exp

ラベル付けされたフィールドを使うコンストラクタが値の生成に使われる場合があるが、その時には各コンポーネントは位置ではなく名前によって指定する。宣言リストの中で使われる中括弧とは異なりレイアウトの対象にならない。{と}の文字は明示しなければならない。(これはフィールドの更新、フィールドパターンにおいても正しい。)フィールドラベルを使用する構築は次の制約に応じる。

指定されたコンストラクタで宣言されたフィールドラベルのみ言及してよい。
フィールドラベルは複数回言及してはならない。
言及されないフィールドは⊥で初期化される。
正格なフィールド(宣言された型のフィールドの接頭語に!が付けられている)が生成の際に省略された時はコンパイルエラーが発生する。厳格なフィールドはセクション4.2.1で説明される。

式F {}は、Fはデータコンストラクタであり、Fがレコード構文により宣言されたかどうかに関わらず、正当である(ただしFが正格フィールドを持たない時に限る。上の4番目の箇条書きを参照)。それはF ⊥₁ … ⊥_nを表し、nはFの引数の数である。

変換： f = vの束縛で、フィールドfはvでラベルする。

C { bs }	=	C (pick₁^C bs _undefined) … (pick_k^C bs undefined)

kはCの引数の数である。

補助関数pick_i^C bs dは次にように定義される。

もし、コンストラクタCのi番目の要素がフィールドラベルfを持ち、if f=vは束縛されたbsに表示されるなら、その時はpick_i^C bs dはvである。言い換えるとpick_i^C bs dはデフォルト値dである。

aexp	→	aexp_⟨qcon⟩ { fbind₁ , … , fbind_n }	(labeled update, n ≥ 1)

フィールドラベルを使ったデータ型に所属する値は非破壊的に更新されるかもしれない。これは元々存在していた値を指定されたフィールドの値で書き換えた新しい値を生成する。更新は次の方法に制限される。

全てのラベルは同じデータ型から取られなければいけない。
少なくともあるコンストラクタは更新の中で全ての言及されたラベルを定義しなければいけない。
2回以上言及されるラベルがあってはならない。
実行エラーは更新された値が全ての明記されたラベルを含まない時に発生する。

変換: 以下は以前のpickの定義を使用する。

e { bs }	=	`case` e `of`
		C₁ v₁ … v_k1 -> C₁ (pick₁^C1 bs v₁) … (pick_{k 1}^C1 bs v _k1)
		...
		C_j v₁ … v_kj -> C_j (pick₁^Cj bs v₁) … (pick_{k j}^Cj bs v _{k_j})
		_ -> `error` "Update error"

{ C₁,...,C_j}はbs内の全てのラベルを含むコンストラクタの集合で、ｋ_iはC_iの引数の数である。

これはラベル付けされたフィールドを使用している例である。

data T    = C1 {f1,f2 :: Int}  
          | C2 {f1 :: Int,  
                f3,f4 :: Char}

式	変換
C1 {f1 = 3}	C1 3 `undefined`
C2 {f1 = 1, f4 = 'A', f3 = 'B'}	C2 1 'B' 'A'
x {f1 = 1}	`case` x `of` C1 _ f2 -> C1 1 f2
	C2 _ f3 f4 -> C2 1 f3 f4

フィールドf1は両方のTのコンストラクタに共通である。この例では、フィールドラベル表記でコンストラクタを使った式をフィールドラベルを使わない同じコンストラクタを使った同値な式へと変換している。もし、x {f2 = 1, f3 = 'x'}のように、どのコンストラクタも、更新で使われたフィールドラベルの集合を定義していないのであれば、コンパイル時エラーという結果になるだろう。

exp	→	exp `::` [context =>] type

式の型シグネチャ は形式e :: tを持つ。eは式で、tは型(セクション4.1.2)であり、それらは明示的に式を分類することに使用され、オーバーロード(セクション4.1.2を参照)するために曖昧な型付けを解決することに使われるかもしれない。式の値はexpの値である。通常の型シグネチャと同様に(セクション4.4.1を参照)、宣言された型はexpから導出可能な主要な型より具体的になるかもしれないが、主要な型より一般的なまたは同程度な型を与えることはエラーである。

変換：

e :: t = let { v :: t;  v = e } in v

パターン はラムダ抽象や関数定義、パターン束縛、リスト内包表記、do式、case式内で現れる。しかしながら、はじめの5つは最終的にcase式に変換されるので、パターンマッチの意味論はcase式のときのみ定めれば十分である。

パターンはこの構文を持つ。

pat	→	lpat qconop pat	(infix constructor)
	\|	lpat
lpat	→	apat
	\|	`-` (integer \| float)	(negative literal)
	\|	gcon apat₁ … apat_k	(arity gcon = k, k ≥ 1)
apat	→	var [ `@` apat]	(as pattern)
	\|	gcon	(arity gcon = 0)
	\|	qcon { fpat1 , … , fpatk }	(labeled pattern, k ≥ 0)
	\|	literal
	\|	`_`	(wildcard)
	\|	( pat )	(parenthesized pattern)
	\|	( pat₁ , … , pat_k )	(tuple pattern, k ≥ 2)
	\|	[ pat₁ , … , pat_k ]	(list pattern, k ≥ 1)
	\|	`~` apat	(irrefutable pattern)
fpat	→	qvar `=` pat

コンストラクタの引数の数はそれに関係するサブパターンの数と一致しなければいけない。部分的に適用されるコンストラクタに反して一致することはできない。

全てのパターンは線形でなければならない。変数は2回以上現れないかもしれない。例として、この定義は不正である。

f (x,x) = x     -- ILLEGAL; x used twice in pattern

形式var@patのパターンはas-patternsと呼ばれ、varをpatによってマッチされた値に付ける名前として使うことができる。例えば以下のものは、

case e of { xs@(x:rest) -> if x==0 then rest else xs }

は次のものと等しい。

let { xs = e } in  
  case xs of { (x:rest) -> if x==0 then rest else xs }

形式_のパターンは ワイルドカード であり、パターンのいくつかの部分が右手側で参照されない時に便利である。それは他の場所で使われない識別子がその場所に置かれているかのようである。例えば、以下は、

case e of { [x,_,_]  ->  if x==0 then True else False }

は次のものと等しい。

case e of { [x,y,z]  ->  if x==0 then True else False }

パターンは値に対してマッチが行われる。パターンマッチを行おうとした場合、次の3つのいずれかの結果を得る。失敗かもしれない、成功かもしれず、その時はパターン内の各変数に束縛を返す、 分岐する かもしれない(例:⊥を返す)。パターンマッチングは次のルールによって外から内へ、左から右へ進行する。

値vに対してマッチするパターンvarのマッチングは常に成功し、varをvに束縛する。
値vに対してマッチするパターン~apatのマッチングは常に成功する。もしvに対してマッチするapatのマッチングが別の方法で成功するならば、apat内の束縛されていない変数は適切な値に束縛される。vに対してマッチするapatのマッチングが失敗または分岐するなら⊥ に束縛される(束縛は評価を ほのめかさない )。

運用上、これはあるapat内の変数が使われるまで、パターン~apatが何とも一致しないことを意味する。その時点でパターン全体はその値に対してマッチし、もし一致が失敗または分岐するなら、全体の計算を行う。
あらゆる値に対してマッチするワイルドパターン_のマッチングは常に成功し、束縛は行われない。
値に対してマッチするパターンcon patのマッチングは、conはnewtypeによって定義されたコンストラクタである、以下の項目でその値に依存する。
- もし値が形式con vであるなら、その時patはvに対してマッチされる。
- もし値が⊥なら、その時patは⊥に対してマッチする。
すなわちnewtypeと関連するコンストラクタが値の型を変更することのみに務める。
値に対してのcon pat₁ ... pat_nのマッチングは、conはdataによって定義されるコンストラクタである、依存するその値に依存する。
- もし値が形式con pat₁ ... pat_nであるなら、サブパターンはそのデータ値の要素に対して左から右へ一致される。もし、全てのマッチングが成功したなら、マッチング全体は成功し、はじめの失敗または分岐はマッチング全体を各々、失敗または分岐へともたらす。
- もし値が形式con' v₁ ... v_mであるなら、conはcon'への異なるコンストラクタである、そのマッチングは失敗する。
- もし値が⊥なら、そのマッチングは分岐する。
ラベル付きフィールドを使ったコンストラクタに対してのマッチングはそのフィールドがフィールドリスト内で指定された順序で照合されることを除いて、通常のコンストラクタパターンのマッチングと同じである。全てのリストされたフィールドはコンストラクタによって宣言されなければならず、フィールドは2回以上指定されないかもしれない。パターンによって指定されたフィールドは無視される(_に対して一致する)。
値v対する数値、文字、文字列リテラルパターンkのマッチングはもし、v == kなら成功する。==はパターンの型を元にオーバロードされる。マッチングはもしこのテストが分岐するなら分岐する。

数値リテラルの解釈はまさにセクション3.2で記載のとおりである。即ち、オーバロードされた関数fromIntegerまたはfromRationalは(それぞれ)適切な型へ変換することによってIntegerまたはRationalリテラルに適用される。

静的型の制約(例えば、文字とbooleanを一致させる静的なエラー)は別として、次の静的クラスの制約は保持する。

整数リテラルパターンはクラスNumの値とのみ照合できる。
浮動小数点リテラルパターンはクラスFactionalの値とのみ照合できる。

2種類のパターンの区別することはしばしば有用である。 反駁できない パターンの照合は厳密ではなく、そのパターンはもし、照合された値が⊥なら一致する。 反駁できる パターンは厳密であり、その一致される値が⊥なら分岐する。反駁できないパターンは次のものである。変数やワイルドカード、Nがnewtypeとapatによって定義されたコンストラクタN apatは反駁できず(セクション4.2.3)、var@apatのapatは反駁できない、または形式~apat(apatが反駁できないかどうか)である。他の全てのパターンは反駁できる。

ここにいくつかの例をだす。

もし、パターン['a','b']が['x',⊥]と一致されるなら、その時、'a'はxとの一致に 失敗し 、その結果は失敗と一致する。しかし、もし['a','b']が[⊥,'x']と一致されるなら、その時、'a'と⊥を一致するよう試みることは分岐と一致することをもたらす。

これらの例は反駁できるものとできないもののマッチングの実演である。

(\ ~(x,y) -> 0) ⊥	⇒	0
(\ (x,y) -> 0) ⊥	⇒	⊥

(\ ~[x] -> 0) []	⇒	0
(\ ~[x] -> x) []	⇒	⊥

(\ ~[x,~(a,b)] -> x) [(0,1),⊥]	⇒	(0,1)
(\ ~[x, (a,b)] -> x) [(0,1),⊥]	⇒	⊥

(\ (x:xs) -> x:x:xs) ⊥	⇒	⊥
(\ ~(x:xs) -> x:x:xs) ⊥	⇒	⊥:⊥:⊥

次の宣言を考えてほしい。
```
newtype N = N Bool  
data    D = D !Bool
```
これらの例はdataとnewtypeによって定義された型においてのパターンマッチングの違いを説明する。

(\ (N True) -> True) ⊥ ⇒ ⊥

(\ (D True) -> True) ⊥ ⇒ ⊥

(\ ~(D True) -> True) ⊥ ⇒ True

追加の例はセクション4.2.3で見つかるだろう。


(\ (N True) -> True) ⊥	⇒	⊥
(\ (D True) -> True) ⊥	⇒	⊥
(\ ~(D True) -> True) ⊥	⇒	True

関数内のcase式内の最上位パターンと最上位パターンの集合またはパターン束縛は0以上の ガード に関係する持つかもしれない。ガードの構文と意味論についてはセクション3.13を参照してもらいたい。

ガード意味論は関数またはcase式の厳密な特徴への影響を持つ。特に、他の反駁できないパターンがガードのために評価されるかもしれない。例えば、次の

f :: (Int,Int,Int) -> [Int] -> Int  
f ~(x,y,z) [a] | (a == y) = 1

aとyの両方はガードの==によって評価される。

case式を除くすべてのパターンマッチの意味論は、パターンマッチの構成とcase式との間を関連付ける等式を与えることで定められる( 訳注 : パターンマッチの意味論は一旦case式を使って定義し、そのあとcase式の意味論に従って処理を行う)。case式の意味論自体は図3.1、3.3の、一連の識別子のように順番に与えられる。どんな実装でもこれらの識別子を保持するために振る舞わなければならず、かなり非効率的なコードを生成することから、それはそれらを直接使用することは期待されない。

(a)	`case e of { alts } = (\v -> case v of { alts }) e where v is a new variable`
(b)	`case v of { p ₁ match₁; … ; p_n match_n } = case v of { p₁ match₁ ; _ -> … case v of { p_n match_n ; _ -> error "No match" }…} where each match_i has the form: \| gs_i,1 -> e_i,1 ; … ; \| gs_{i,m_i} -> e_{i,m_i} where { decls_i }`
(c)	`case v of { p \| gs₁ -> e₁ ; … \| gs_n -> e_n where { decls } _ -> e′ } = case e′ of { y -> case v of { p -> let { decls } in case () of { () \| gs₁ -> e₁; _ -> … case () of { () \| gs_n -> e_n; _ -> y } … } _ -> y }} where y is a new variable`
(d)	`case v of { ~p -> e; _ -> e′ } = (\x₁ … x_n -> e ) (case v of { p-> x₁ })… (case v of { p -> x_n}) where x₁,…,x_n are all the variables in p`
(e)	`case v of { x@p -> e; _ -> e′ } = case v of { p -> ( \ x -> e ) v ; _ -> e′ }`
(f)	`case v of { _ -> e; _ -> e′ } = e`

図 3.1: case式の意味論、パート1

(g)	`case v of { K p₁…p_n -> e; _ -> e′ } = case v of { K x₁…x_n -> case x₁ of { p₁ -> … case xn of { p_n -> e ; _ -> e′ } … _ -> e′ } _ -> e′ } at least one of p₁,…,p_n is not a variable; x₁,…,x_n are new variables`
(h)	`case v of { k -> e; _ -> e′ } = if (v==k) then e else e′ where k is a numeric, character, or string literal`
(i)	`case v of { x -> e; _ -> e′ } = case v of { x -> e }`
(j)	`case v of { x -> e } = ( \ x -> e ) v`
(k)	`case N v of { N p -> e; _ -> e′ } = case v of { p -> e; _ -> e′ } where N is a newtype constructor`
(l)	`case ⊥ of { N p -> e; _ -> e′ } = case ⊥ of { p -> e } where N is a newtype constructor`
(m)	`case v of { K { f₁ = p₁ , f₂ = p₂ , … } -> e ; _ -> e′ } = case e′ of { y -> case v of { K { f₁ = p₁ } -> case v of { K { f₂ = p₂ , … } -> e ; _ -> y }; _ -> y }} where f₁, f₂, … are fields of constructor K; y is a new variable`
(n)	`case v of { K { f = p } -> e ; _ -> e′ } = case v of { K p₁ … p_n -> e ; _ -> e′ } where p_i is p if f labels the ith component of K, _ otherwise`
(o)	`case v of { K {} -> e ; _ -> e′ } = case v of { K _ … _ -> e ; _ -> e′ }`
(p)	`case (K′ e₁ … e_m) of { K x₁ … x_n -> e; _ -> e′ } = e′ where K and K′ are distinct data constructors of arity n and m, respectively`
(q)	`case (K e₁ … e_n) of { K x₁ … x_n -> e; _ -> e′ } = (\x₁ … x_n -> e) e₁ … e_n where K is a data constructor of arity n`
(r)	`case ⊥ of { K x₁ … x_n -> e; _ -> e′ } = ⊥ where K is a data constructor of arity n`

図 3.2: case式の意味論、パート2

(s)	`case () of { () \| g₁, …, g_n -> e; _ -> e′ } = case () of { () \| g₁ -> … case () of { () \| g_n -> e; _ -> e′ } … _ -> e′ } where y is a new variable`
(t)	`case() of { () \| p <- e₀ -> e; _ -> e′ } = case e₀ of { p -> e; _ -> e′ }`
(u)	`case () of { () \| let decls -> e; _ -> e′ } = let decls in e`
(v)	`case () of { () \| e₀ -> e; _ -> e′ } = if e₀ then e else e′`

図 3.3: case式の意味論、パート3

図3.1-3.3のe, e'とe_iは式で、g_iとgs_iはガードと各々のガードの並びであり、pとp_iはパターン、v, x, x_iは変数、K,K'は代数的データ型(data)コンストラクタ(タプルコンストラクタを含む)で、Nはnewtypeコンストラクタである。

ルール(b)は実際にガードを含むかどうかにはかかわらず、一般的な表層ソース言語のcase式に適合するものである。もしガードが書かれていなければ、その時、Trueが形式match_i内のガードgs_i,jに代用される。各々の識別子はもっと簡単な形式へとcase式の結果を操作する。

図3.2のルール(h)はオーバロードされた==演算子を起動し、パターンマッチングの意味をオーバーロードされた定数に対して定義するというルールである。

これらの識別子は静的な意味論を全て保存する。ルール(d)、(e)、(j)、(q)はletではなくラムダを使っていて、これはcaseによって束縛された変数が単相型ということを示す(セクション4.1.4を参照)。

[ e \| `True` ]	=	[e]
[ e \| q ]	=	[ e \| q, `True` ]
[ e \| b, Q ]	=	`if` b `then` [ e \| Q ] `else` []
[ e \| p <- l, Q ]	=	`let` `ok` p = [ e \| Q ]
		`ok` _ = []
		`in` `concatMap` `ok` l
[ e \| `let` decls, Q ]	=	`let` decls `in` [ e \| Q ]

Haskell2010 Language Report 日本語訳

式

エラー

変数、コンストラクタ、演算子、リテラル

カリー化された適用とラムダ抽象

演算子適用

セクション

条件文

リスト

タプル

単位式と括弧付き式

数列

リスト内包表記

Let式

Case式

Do式

フィールドラベル付きのデータ型

フィールドセレクション

フィールドラベルを用いた生成

フィールドラベルを使用した更新

式の型シグネチャ

パターンマッチング

パターン

パターンマッチングの非形式的の意味論

パターンマッチングの正式な意味論