440 lines
14 KiB
JavaScript
440 lines
14 KiB
JavaScript
import R from 'ramda'
|
|
import { expect } from 'chai'
|
|
import daggy from 'daggy'
|
|
import { Maybe as M } from 'ramda-fantasy'
|
|
import { StateT, Writer } from 'akh'
|
|
|
|
describe('simplified tree walks', function() {
|
|
// Notre domaine peut se simplifier à une liste d'équations à trous:
|
|
// a: 45
|
|
// b: a + c
|
|
// d: a + 4
|
|
// e: b + d
|
|
// Disons que je veux connaitre "e", alors il va me manquer "c"
|
|
// Si je connais "c", alors je peux calculer "e"
|
|
// Et mon ambition est aussi de pouvoir visualiser le calcul en HTML
|
|
// Donc j'ai une structure plate que je transforme en arbre (ce n'est pas
|
|
// le focus de la présente exploration), je veux pouvoir demander des choses
|
|
// diverses à cet arbre: l'évaluer, repérer les trous, le transformer en HTML
|
|
|
|
// Plus tard je vais avoir des trucs plus sophistiqués, par exemple:
|
|
// b: a + (bleu: b, vert: c)
|
|
// qui est équivalent à:
|
|
// b: b-bleu + b-vert
|
|
// b-bleu: a + b
|
|
// b-vert: a + c
|
|
// Le but du jeu est de pouvoir le représenter de façon compacte, mais
|
|
// d'avoir un arbre simple à manipuler
|
|
|
|
// Pour intégrer dans le simulateur, il faut remplir les exigences
|
|
// suivantes:
|
|
// X décorer l'arbre avec une valeur à chaque noeud
|
|
// X réaliser le calcul de façon efficiente (1 fois par variable)
|
|
// - savoir "court-circuiter" le calcul de variables manquantes dans les conditionnelles
|
|
// - avoir un moyen de gérer les composantes et filtrage
|
|
|
|
// Ce qu'on décrit est un framework de programmation déclarative: on stipule des
|
|
// définitions (salaire net = brut - cotisations) mais on les donne sans ordre
|
|
// impératif, on laisse au moteur le soin de calculer les dépendances
|
|
|
|
// Chaque élément de notre base de règles est une définition:
|
|
|
|
const Def = daggy.taggedSum('Def', {
|
|
Assign: ['name', 'expr']
|
|
})
|
|
const { Assign } = Def
|
|
|
|
// Par contre, à l'exécution, il faut bien calculer des "effets de bord"
|
|
// pour rester performant: chaque évaluation d'une définition doit mettre
|
|
// à jour le 'dictionnaire' des valeurs connues, puis le mettre à disposition
|
|
// de la suite du calcul - on verra comment au Chapitre 3
|
|
|
|
// La partie droite d'une définition est une expression:
|
|
|
|
const Expr = daggy.taggedSum('Expr', {
|
|
Num: ['x'],
|
|
Add: ['x', 'y'],
|
|
Var: ['name']
|
|
// NotIf: ['condition','formule'],
|
|
// OnlyIf: ['condition','formule'],
|
|
// AnyOf: ['conditions'],
|
|
// AllOf: ['conditions'],
|
|
})
|
|
const { Num, Add, Var } = Expr
|
|
|
|
// Chapitre 1...
|
|
|
|
// Le type Expr est la traduction en JS du type suivant en Haskell,
|
|
// "naivement récursif":
|
|
// data Expr = Num Int | Var String | Add Expr Expr
|
|
|
|
// Il se trouve qu'on peut gagner beaucoup en introduisant une petite
|
|
// complexité: on va exprimer la récursion avec un niveau d'indirection,
|
|
// la première étape étant de rendre le type polymorphique sur ce qui
|
|
// est récursif:
|
|
|
|
// data ExprF r = Num Int | Var String | Add r r
|
|
|
|
// Par exemple, une addition de deux additions c'est de type ExprF (ExprF r),
|
|
// et si je veux décrire des imbrications plus poussées d'additions dans
|
|
// des additions il me faudra un ExprF (ExprF (ExprF r)) et ainsi de
|
|
// suite: on a "déroulé" la récursion dans le type d'origine.
|
|
|
|
// On peut alors retrouver le type d'origine en introduisant un
|
|
// "constructeur de point fixe de type", appelé Fx, et en introduisant
|
|
// ce qu'on appelle un "functor type" (c'est le suffixe F)
|
|
|
|
// data Expr = Fx ExprF
|
|
|
|
// Le point fixe de f est une solution à l'équation x = f x - on
|
|
// peut l'appliquer à des fonctions récursives, voir par exemple:
|
|
// https://www.vex.net/~trebla/haskell/fix.xhtml
|
|
|
|
// En JS ça ne marche pas parce que JS est strict et non lazy...
|
|
|
|
// Quand au point fixe d'un type, c'est le point fixe de son
|
|
// constructeur: une solution à l'équation T = Fx T
|
|
|
|
// En JS c'est juste une fonction qui emballe et une qui déballe:
|
|
|
|
const Fx = daggy.tagged('Fx', ['x'])
|
|
Fx.prototype.project = function() {
|
|
return this.x
|
|
}
|
|
const unFix = fx => fx.project()
|
|
|
|
// Les helpers suivants rendent moins pénible la construction de valeurs
|
|
// notamment pour les tests
|
|
|
|
let num = x => Fx(Num(x))
|
|
let add = (x, y) => Fx(Add(x, y))
|
|
let ref = name => Fx(Var(name))
|
|
|
|
// Une application de la théorie des catégories permet de dériver
|
|
// la fonction "fold" suivante, qui généralise aux structures récursives
|
|
// la notion de "reduction" (comme pour les listes), on l'appelle aussi
|
|
// un catamorphisme
|
|
|
|
// fold :: Functor f => (f a -> a) -> Fix f -> a
|
|
const fold = R.curry((algebra, x) =>
|
|
R.compose(algebra, R.map(fold(algebra)), unFix)(x)
|
|
)
|
|
|
|
// Cf. https://www.schoolofhaskell.com/user/bartosz/understanding-algebras
|
|
|
|
// Dans ce contexte, un "algebre" est une fonction qui nous dit comment calculer
|
|
// la réduction pour un noeud à partir des valeurs calculées pour les noeuds fils
|
|
|
|
// Cette fonction fournit la traversée
|
|
Expr.prototype.map = function(f) {
|
|
return this.cata({
|
|
Num: x => this, // fixed
|
|
Add: (x, y) => Add(f(x), f(y)),
|
|
Var: name => this
|
|
})
|
|
}
|
|
|
|
// Celle-ci l'évaluation
|
|
const evaluator = state => a => {
|
|
return a.cata({
|
|
Num: x => M.Just(x),
|
|
Add: (x, y) => R.lift(R.add)(x, y),
|
|
Var: name => M.toMaybe(state[name]) // Doesn't typecheck
|
|
})
|
|
}
|
|
|
|
let evaluate = (expr, state = {}) =>
|
|
fold(evaluator(state), expr).getOrElse(null) // for convenience
|
|
|
|
// Voici donc l'évaluation d'un arbre...
|
|
|
|
it('should provide a protocol for evaluation', function() {
|
|
let tree = num(45),
|
|
result = evaluate(tree)
|
|
expect(result).to.equal(45)
|
|
})
|
|
|
|
it('should evaluate expressions', function() {
|
|
let tree = add(num(45), num(25)),
|
|
result = evaluate(tree)
|
|
expect(result).to.equal(70)
|
|
})
|
|
|
|
it('should evaluate nested expressions', function() {
|
|
let tree = add(num(45), add(num(15), num(10))),
|
|
result = evaluate(tree)
|
|
expect(result).to.equal(70)
|
|
})
|
|
|
|
// Problème: on évalue l'arbre tout entier d'un seul coup; mais
|
|
// peut-on aussi "décorer" l'arbre pendant sa traversée avec les
|
|
// valeurs intermédiaires ? On verra que oui, au Chapitre 2; en
|
|
// attendant on voudrait aussi savoir quelles sont les variables
|
|
// manquantes...
|
|
|
|
const collector = state => a => {
|
|
return a.cata({
|
|
Num: x => [],
|
|
Add: (x, y) => R.concat(x, y),
|
|
Var: name => (state[name] ? [] : [name])
|
|
})
|
|
}
|
|
|
|
let missing = (expr, state = {}) => fold(collector(state), expr)
|
|
|
|
it('should evaluate expressions involving variables', function() {
|
|
let tree = add(num(45), ref('a')),
|
|
result = evaluate(tree, { a: 25 })
|
|
expect(result).to.equal(70)
|
|
})
|
|
|
|
it('should evaluate expressions involving missing variables', function() {
|
|
let tree = add(num(45), ref('b')),
|
|
result = evaluate(tree, { a: 25 })
|
|
expect(result).to.equal(null)
|
|
})
|
|
|
|
it('should provide a protocol for missing variables', function() {
|
|
let tree = ref('a'),
|
|
result = missing(tree)
|
|
expect(result).to.deep.equal(['a'])
|
|
})
|
|
|
|
it('should locate missing variables in expressions', function() {
|
|
let tree = add(num(45), ref('a')),
|
|
result = missing(tree)
|
|
expect(result).to.deep.equal(['a'])
|
|
})
|
|
|
|
it('should locate missing variables in nested expressions', function() {
|
|
let tree = add(add(num(35), ref('a')), num(25)),
|
|
result = missing(tree)
|
|
expect(result).to.deep.equal(['a'])
|
|
})
|
|
|
|
it('should locate missing variables in nested expressions', function() {
|
|
let tree = add(add(num(35), ref('a')), num(25)),
|
|
result = missing(tree, { a: 25 })
|
|
expect(result).to.deep.equal([])
|
|
})
|
|
|
|
// Chapitre 2...
|
|
|
|
// Pour annoter l'arbre avec les valeurs intermédiaires on utilise un
|
|
// type "Cofree Comonad": ce sont des paires (fst,snd) dont la première
|
|
// valeur est un noeud de l'arbre et la seconde l'annotation; on a un
|
|
// constructeur ann et une fonction de lecture
|
|
|
|
// Cf https://github.com/willtim/recursion-schemes/
|
|
// or http://www.timphilipwilliams.com/slides/HaskellAtBarclays.pdf
|
|
|
|
const AnnF = daggy.tagged('AnnF', ['fr', 'a'])
|
|
let ann = ({ fst, snd }) => Fx(AnnF(fst, snd))
|
|
let nodeValue = annf => {
|
|
let { fr, a } = unFix(annf)
|
|
return a
|
|
}
|
|
|
|
// fork est l'opérateur "&&&" de Haskell: (f &&& g) x = Pair(f(x),g(x))
|
|
let fork = (f, g) => x => ({ fst: f(x), snd: g(x) })
|
|
|
|
// synthesize combine l'application d'un algèbre fourni f et de l'annotation
|
|
let synthesize = f => {
|
|
let algebra = f =>
|
|
R.compose(ann, fork(R.identity, R.compose(f, R.map(nodeValue))))
|
|
return fold(algebra(f))
|
|
}
|
|
|
|
let annotate = (state, tree) => synthesize(evaluator(state))(tree)
|
|
|
|
it('should annotate tree with evaluation results', function() {
|
|
let tree = add(num(45), add(num(15), num(10))),
|
|
result = nodeValue(annotate({}, tree)).getOrElse(null)
|
|
expect(result).to.equal(70)
|
|
})
|
|
|
|
// Chapitre 3
|
|
|
|
// On sait evaluer des expressions, il faut aussi être capable de
|
|
// gérer les règles définissant les variables appelées dans ces
|
|
// expressions; voyons ce que ça donne avec un algèbre plus simple:
|
|
|
|
let calculate = R.curry((rules, name) => {
|
|
let find = (rules, name) =>
|
|
R.find(x => R.prop('name', x) == name, rules).expr,
|
|
expr = find(rules, name)
|
|
return fold(evaluator2(calculate(rules)), expr)
|
|
})
|
|
|
|
const evaluator2 = calculate => a => {
|
|
return a.cata({
|
|
Num: x => x,
|
|
Add: (x, y) => x + y,
|
|
Var: name => calculate(name)
|
|
})
|
|
}
|
|
|
|
it('should resolve variable dependencies', function() {
|
|
let rule1 = Assign('a', add(ref('b'), ref('b'))),
|
|
rule2 = Assign('b', num(15)),
|
|
rules = [rule1, rule2],
|
|
result = calculate(rules, 'a')
|
|
expect(result).to.equal(30)
|
|
})
|
|
|
|
// Utilisons un Writer (un idiome fonctionnel pour par exemple écrire des logs)
|
|
// pour examiner le calcul de plus près.
|
|
|
|
const Str = daggy.tagged('Str', ['s'])
|
|
Str.zero = Str('')
|
|
Str.prototype.zero = Str.zero
|
|
Str.prototype.concat = function(b) {
|
|
return Str(this.s + b.s)
|
|
}
|
|
|
|
let trace = R.curry((rules, name) => {
|
|
let find = (rules, name) =>
|
|
R.find(x => R.prop('name', x) == name, rules).expr,
|
|
expr = find(rules, name)
|
|
return fold(tracer(trace(rules)), expr)
|
|
})
|
|
|
|
const tracer = recurse => a => {
|
|
let log = (x, s) => Writer.tell(Str(s)).map(_ => x)
|
|
return a.cata({
|
|
Num: x => log(x, x + ','),
|
|
Add: (x, y) => x.chain(xx => y.chain(yy => log(xx + yy, '+,'))),
|
|
Var: name => recurse(name).chain(x => log(x, name + ','))
|
|
})
|
|
}
|
|
|
|
// On voit qu'on a calculé la valeur de b 2 fois! Ce n'est pas utile,
|
|
// puisque cette valeur ne changera pas au cours du calcul; et comme on
|
|
// répète le calcul autant de fois qu'il y a de références à une variable
|
|
// donnée, si l'arbre est un tant soit peu complexe les performances seront
|
|
// très mauvaises.
|
|
|
|
it('should trace the shape of the computation', function() {
|
|
let rule1 = Assign('a', add(ref('b'), ref('b'))),
|
|
rule2 = Assign('b', num(15)),
|
|
rules = [rule1, rule2],
|
|
result = trace(rules, 'a').run(Str.zero)
|
|
expect(result.value).to.equal(30)
|
|
expect(result.output.s).to.equal('15,b,15,b,+,')
|
|
})
|
|
|
|
// Pour corriger ce problème on va avoir besoin de formuler une version
|
|
// "monadique" du catamorphisme, c'est-à-dire qu'on va pouvoir l'associer
|
|
// à un contexte (ou monade) dans lequel tout le calcul va se dérouler,
|
|
// et qui va pouvoir accumuler des informations au fur et à mesure, par
|
|
// exemple un cache des variables déjà calculées.
|
|
|
|
// On a déjà vu un exemple de monade, c'était Writer: voyons comment on
|
|
// reformule le catamorphisme pour qu'il se déroule dans la monade Writer.
|
|
// L'implémentation de cataM est inspirée de
|
|
// https://github.com/DrBoolean/excursion/
|
|
// D'abord on ajoute de la plomberie:
|
|
|
|
const cataM = (of, algM) => m =>
|
|
m
|
|
.project()
|
|
.traverse(of, x => x.cataM(of, algM))
|
|
.chain(algM)
|
|
|
|
const traverse = function(of, f) {
|
|
return this.cata({
|
|
Num: x => of(this),
|
|
Add: (x, y) => f(x).chain(xx => f(y).chain(yy => of(Add(xx, yy)))),
|
|
Var: name => of(this)
|
|
})
|
|
}
|
|
Expr.prototype.traverse = traverse
|
|
Fx.prototype.cataM = function(of, alg) {
|
|
return cataM(of, alg)(this)
|
|
}
|
|
|
|
// Maintenant que c'est fait on voit qu'on a simplifié l'expression du
|
|
// catamorphisme: on n'a plus à expliciter l'enchaînement (sauf pour la
|
|
// récursion de plus haut niveau dans les variables)
|
|
|
|
let trace2 = R.curry((rules, name) => {
|
|
let find = (rules, name) =>
|
|
R.find(x => R.prop('name', x) == name, rules).expr,
|
|
expr = find(rules, name)
|
|
return cataM(Writer.of, tracer2(trace2(rules)))(expr)
|
|
})
|
|
|
|
const tracer2 = recurse => a => {
|
|
let log = (x, s) => Writer.tell(Str(s)).map(_ => x)
|
|
return a.cata({
|
|
Num: x => log(x, x + ','),
|
|
Add: (x, y) => log(x + y, '+,'),
|
|
Var: name => recurse(name).chain(x => log(x, name + ','))
|
|
})
|
|
}
|
|
|
|
it('should trace the shape of the computation, showing two passes through b', function() {
|
|
let rule1 = Assign('a', add(ref('b'), ref('c'))),
|
|
rule2 = Assign('b', num(15)),
|
|
rule3 = Assign('c', num(10)),
|
|
rules = [rule1, rule2, rule3],
|
|
result = trace2(rules, 'a').run(Str.zero)
|
|
expect(result.value).to.equal(25)
|
|
expect(result.output.s).to.equal('15,b,10,c,+,')
|
|
})
|
|
|
|
// On a la possibilité "d'encapsuler" une monade dans une autre:
|
|
// on va se doter d'un State, une monade qui permet de stocker un
|
|
// état et de le modifier en le propageant dans tout le calcul, et
|
|
// conserver Writer à l'intérieur (on utilise la variante StateT,
|
|
// le T veut dire "transformation de monade")
|
|
|
|
// On peut aller plus loin et mémoiser le catamorphisme:
|
|
// https://idontgetoutmuch.wordpress.com/2011/05/15/monadic-caching-folds/
|
|
// ça ne semble pas nécessaire ici puisque tout se passe au niveau de
|
|
// la récursion sur "Var"
|
|
|
|
const S = StateT(Writer)
|
|
const log = (x, s) => S.lift(S.inner.tell(Str(s)).map(_ => x))
|
|
|
|
let trace3 = R.curry((rules, name) => {
|
|
let find = (rules, name) =>
|
|
R.find(x => R.prop('name', x) == name, rules).expr,
|
|
expr = find(rules, name)
|
|
return cataM(S.of, tracer3(trace3(rules)))(expr)
|
|
})
|
|
|
|
const memoize = f => name => {
|
|
let cache = result =>
|
|
result.chain(x =>
|
|
result
|
|
.modify(state => R.assoc(name, run(result), state))
|
|
.chain(z => S.of(x))
|
|
)
|
|
|
|
return S.get.chain(state => {
|
|
let cached = state[name]
|
|
return cached ? S.of(cached.value.value) : cache(f(name))
|
|
})
|
|
}
|
|
|
|
const tracer3 = recurse => a => {
|
|
return a.cata({
|
|
Num: x => log(x, x + ','),
|
|
Add: (x, y) => log(x + y, '+,'),
|
|
Var: memoize(name => recurse(name).chain(x => log(x, name + ',')))
|
|
})
|
|
}
|
|
|
|
const run = (c, state) => Writer.run(StateT.run(c, state), Str.zero)
|
|
|
|
it('should trace the shape of the computation, showing one pass through b', function() {
|
|
let rule1 = Assign('a', add(ref('b'), ref('b'))),
|
|
rule2 = Assign('b', num(15)),
|
|
rules = [rule1, rule2],
|
|
result = run(trace3(rules, 'a'), {})
|
|
expect(result.value.value).to.equal(30)
|
|
expect(result.output.s).to.equal('15,b,+,')
|
|
})
|
|
})
|