429 lines
14 KiB
JavaScript
429 lines
14 KiB
JavaScript
import R from 'ramda'
|
|
import {expect} from 'chai'
|
|
import daggy from 'daggy'
|
|
import {Maybe as M} from 'ramda-fantasy'
|
|
import {StateT, Writer} from 'akh'
|
|
|
|
describe('simplified tree walks', function() {
|
|
|
|
// Notre domaine peut se simplifier à une liste d'équations à trous:
|
|
// a: 45
|
|
// b: a + c
|
|
// d: a + 4
|
|
// e: b + d
|
|
// Disons que je veux connaitre "e", alors il va me manquer "c"
|
|
// Si je connais "c", alors je peux calculer "e"
|
|
// Et mon ambition est aussi de pouvoir visualiser le calcul en HTML
|
|
// Donc j'ai une structure plate que je transforme en arbre (ce n'est pas
|
|
// le focus de la présente exploration), je veux pouvoir demander des choses
|
|
// diverses à cet arbre: l'évaluer, repérer les trous, le transformer en HTML
|
|
|
|
// Plus tard je vais avoir des trucs plus sophistiqués, par exemple:
|
|
// b: a + (bleu: b, vert: c)
|
|
// qui est équivalent à:
|
|
// b: b-bleu + b-vert
|
|
// b-bleu: a + b
|
|
// b-vert: a + c
|
|
// Le but du jeu est de pouvoir le représenter de façon compacte, mais
|
|
// d'avoir un arbre simple à manipuler
|
|
|
|
// Pour intégrer dans le simulateur, il faut remplir les exigences
|
|
// suivantes:
|
|
// X décorer l'arbre avec une valeur à chaque noeud
|
|
// X réaliser le calcul de façon efficiente (1 fois par variable)
|
|
// - savoir "court-circuiter" le calcul de variables manquantes dans les conditionnelles
|
|
// - avoir un moyen de gérer les composantes et filtrage
|
|
|
|
// Ce qu'on décrit est un framework de programmation déclarative: on stipule des
|
|
// définitions (salaire net = brut - cotisations) mais on les donne sans ordre
|
|
// impératif, on laisse au moteur le soin de calculer les dépendances
|
|
|
|
// Chaque élément de notre base de règles est une définition:
|
|
|
|
const Def = daggy.taggedSum('Def', {
|
|
Assign: ['name', 'expr']
|
|
})
|
|
const {Assign} = Def
|
|
|
|
// Par contre, à l'exécution, il faut bien calculer des "effets de bord"
|
|
// pour rester performant: chaque évaluation d'une définition doit mettre
|
|
// à jour le 'dictionnaire' des valeurs connues, puis le mettre à disposition
|
|
// de la suite du calcul - on verra comment au Chapitre 3
|
|
|
|
// La partie droite d'une définition est une expression:
|
|
|
|
const Expr = daggy.taggedSum('Expr',{
|
|
Num: ['x'],
|
|
Add: ['x', 'y'],
|
|
Var: ['name']
|
|
// NotIf: ['condition','formule'],
|
|
// OnlyIf: ['condition','formule'],
|
|
// AnyOf: ['conditions'],
|
|
// AllOf: ['conditions'],
|
|
})
|
|
const {Num, Add, Var} = Expr
|
|
|
|
// Chapitre 1...
|
|
|
|
// Le type Expr est la traduction en JS du type suivant en Haskell,
|
|
// "naivement récursif":
|
|
// data Expr = Num Int | Var String | Add Expr Expr
|
|
|
|
// Il se trouve qu'on peut gagner beaucoup en introduisant une petite
|
|
// complexité: on va exprimer la récursion avec un niveau d'indirection,
|
|
// la première étape étant de rendre le type polymorphique sur ce qui
|
|
// est récursif:
|
|
|
|
// data ExprF r = Num Int | Var String | Add r r
|
|
|
|
// Par exemple, une addition de deux additions c'est de type ExprF (ExprF r),
|
|
// et si je veux décrire des imbrications plus poussées d'additions dans
|
|
// des additions il me faudra un ExprF (ExprF (ExprF r)) et ainsi de
|
|
// suite: on a "déroulé" la récursion dans le type d'origine.
|
|
|
|
// On peut alors retrouver le type d'origine en introduisant un
|
|
// "constructeur de point fixe de type", appelé Fx, et en introduisant
|
|
// ce qu'on appelle un "functor type" (c'est le suffixe F)
|
|
|
|
// data Expr = Fx ExprF
|
|
|
|
// Le point fixe de f est une solution à l'équation x = f x - on
|
|
// peut l'appliquer à des fonctions récursives, voir par exemple:
|
|
// https://www.vex.net/~trebla/haskell/fix.xhtml
|
|
|
|
// En JS ça ne marche pas parce que JS est strict et non lazy...
|
|
|
|
// Quand au point fixe d'un type, c'est le point fixe de son
|
|
// constructeur: une solution à l'équation T = Fx T
|
|
|
|
// En JS c'est juste une fonction qui emballe et une qui déballe:
|
|
|
|
const Fx = daggy.tagged('Fx',['x'])
|
|
Fx.prototype.project = function() { return this.x }
|
|
const unFix = fx => fx.project()
|
|
|
|
// Les helpers suivants rendent moins pénible la construction de valeurs
|
|
// notamment pour les tests
|
|
|
|
let num = x => Fx(Num(x))
|
|
let add = (x, y) => Fx(Add(x,y))
|
|
let ref = (name) => Fx(Var(name))
|
|
|
|
// Une application de la théorie des catégories permet de dériver
|
|
// la fonction "fold" suivante, qui généralise aux structures récursives
|
|
// la notion de "reduction" (comme pour les listes), on l'appelle aussi
|
|
// un catamorphisme
|
|
|
|
// fold :: Functor f => (f a -> a) -> Fix f -> a
|
|
const fold = R.curry((algebra, x) => R.compose(algebra, R.map(fold(algebra)), unFix)(x))
|
|
|
|
// Cf. https://www.schoolofhaskell.com/user/bartosz/understanding-algebras
|
|
|
|
// Dans ce contexte, un "algebre" est une fonction qui nous dit comment calculer
|
|
// la réduction pour un noeud à partir des valeurs calculées pour les noeuds fils
|
|
|
|
// Cette fonction fournit la traversée
|
|
Expr.prototype.map = function(f) {
|
|
return this.cata({
|
|
Num: (x) => this, // fixed
|
|
Add: (x, y) => Add(f(x), f(y)),
|
|
Var: (name) => this
|
|
})
|
|
}
|
|
|
|
// Celle-ci l'évaluation
|
|
const evaluator = state => a => {
|
|
return a.cata({
|
|
Num: (x) => M.Just(x),
|
|
Add: (x, y) => R.lift(R.add)(x,y),
|
|
Var: (name) => M.toMaybe(state[name]) // Doesn't typecheck
|
|
})
|
|
}
|
|
|
|
let evaluate = (expr, state={}) =>
|
|
fold(evaluator(state), expr)
|
|
.getOrElse(null) // for convenience
|
|
|
|
// Voici donc l'évaluation d'un arbre...
|
|
|
|
it('should provide a protocol for evaluation', function() {
|
|
let tree = num(45),
|
|
result = evaluate(tree)
|
|
expect(result).to.equal(45)
|
|
});
|
|
|
|
it('should evaluate expressions', function() {
|
|
let tree = add(num(45),num(25)),
|
|
result = evaluate(tree)
|
|
expect(result).to.equal(70)
|
|
});
|
|
|
|
it('should evaluate nested expressions', function() {
|
|
let tree = add(num(45),add(num(15),num(10))),
|
|
result = evaluate(tree)
|
|
expect(result).to.equal(70)
|
|
});
|
|
|
|
// Problème: on évalue l'arbre tout entier d'un seul coup; mais
|
|
// peut-on aussi "décorer" l'arbre pendant sa traversée avec les
|
|
// valeurs intermédiaires ? On verra que oui, au Chapitre 2; en
|
|
// attendant on voudrait aussi savoir quelles sont les variables
|
|
// manquantes...
|
|
|
|
const collector = state => a => {
|
|
return a.cata({
|
|
Num: (x) => [],
|
|
Add: (x, y) => R.concat(x,y),
|
|
Var: (name) => state[name] ? [] : [name]
|
|
})
|
|
}
|
|
|
|
let missing = (expr, state={}) =>
|
|
fold(collector(state), expr)
|
|
|
|
it('should evaluate expressions involving variables', function() {
|
|
let tree = add(num(45),ref("a")),
|
|
result = evaluate(tree,{a:25})
|
|
expect(result).to.equal(70)
|
|
});
|
|
|
|
it('should evaluate expressions involving missing variables', function() {
|
|
let tree = add(num(45),ref("b")),
|
|
result = evaluate(tree,{a:25})
|
|
expect(result).to.equal(null)
|
|
});
|
|
|
|
it('should provide a protocol for missing variables', function() {
|
|
let tree = ref("a"),
|
|
result = missing(tree)
|
|
expect(result).to.deep.equal(["a"])
|
|
});
|
|
|
|
it('should locate missing variables in expressions', function() {
|
|
let tree = add(num(45),ref("a")),
|
|
result = missing(tree)
|
|
expect(result).to.deep.equal(["a"])
|
|
});
|
|
|
|
it('should locate missing variables in nested expressions', function() {
|
|
let tree = add(add(num(35),ref("a")),num(25)),
|
|
result = missing(tree)
|
|
expect(result).to.deep.equal(["a"])
|
|
});
|
|
|
|
it('should locate missing variables in nested expressions', function() {
|
|
let tree = add(add(num(35),ref("a")),num(25)),
|
|
result = missing(tree,{a:25})
|
|
expect(result).to.deep.equal([])
|
|
});
|
|
|
|
// Chapitre 2...
|
|
|
|
// Pour annoter l'arbre avec les valeurs intermédiaires on utilise un
|
|
// type "Cofree Comonad": ce sont des paires (fst,snd) dont la première
|
|
// valeur est un noeud de l'arbre et la seconde l'annotation; on a un
|
|
// constructeur ann et une fonction de lecture
|
|
|
|
// Cf https://github.com/willtim/recursion-schemes/
|
|
// or http://www.timphilipwilliams.com/slides/HaskellAtBarclays.pdf
|
|
|
|
const AnnF = daggy.tagged('AnnF',['fr','a'])
|
|
let ann = ({fst, snd}) => Fx(AnnF(fst,snd))
|
|
let nodeValue = annf => {
|
|
let {fr, a} = unFix(annf)
|
|
return a
|
|
}
|
|
|
|
// fork est l'opérateur "&&&" de Haskell: (f &&& g) x = Pair(f(x),g(x))
|
|
let fork = (f, g) => x => ({fst:f(x), snd:g(x)})
|
|
|
|
// synthesize combine l'application d'un algèbre fourni f et de l'annotation
|
|
let synthesize = f => {
|
|
let algebra = f => R.compose(ann, fork(R.identity, R.compose(f, R.map(nodeValue))))
|
|
return fold(algebra(f))
|
|
}
|
|
|
|
let annotate = (state, tree) => synthesize(evaluator(state))(tree)
|
|
|
|
it('should annotate tree with evaluation results', function() {
|
|
let tree = add(num(45),add(num(15),num(10))),
|
|
result = nodeValue(annotate({},tree)).getOrElse(null)
|
|
expect(result).to.equal(70)
|
|
});
|
|
|
|
// Chapitre 3
|
|
|
|
// On sait evaluer des expressions, il faut aussi être capable de
|
|
// gérer les règles définissant les variables appelées dans ces
|
|
// expressions; voyons ce que ça donne avec un algèbre plus simple:
|
|
|
|
let calculate = R.curry((rules, name) => {
|
|
let find = (rules, name) => R.find(x => R.prop("name",x) == name,rules).expr,
|
|
expr = find(rules, name)
|
|
return fold(evaluator2(calculate(rules)), expr)
|
|
})
|
|
|
|
const evaluator2 = calculate => a => {
|
|
return a.cata({
|
|
Num: (x) => x,
|
|
Add: (x, y) => x+y,
|
|
Var: (name) => calculate(name)
|
|
})
|
|
}
|
|
|
|
it('should resolve variable dependencies', function() {
|
|
let rule1 = Assign("a",add(ref("b"),ref("b"))),
|
|
rule2 = Assign("b",num(15)),
|
|
rules = [rule1,rule2],
|
|
result = calculate(rules,"a")
|
|
expect(result).to.equal(30)
|
|
});
|
|
|
|
// Utilisons un Writer (un idiome fonctionnel pour par exemple écrire des logs)
|
|
// pour examiner le calcul de plus près.
|
|
|
|
const Str = daggy.tagged("Str",['s'])
|
|
Str.zero = Str("")
|
|
Str.prototype.zero = Str.zero
|
|
Str.prototype.concat = function(b) { return Str(this.s+b.s)}
|
|
|
|
let trace = R.curry((rules, name) => {
|
|
let find = (rules, name) => R.find(x => R.prop("name",x) == name,rules).expr,
|
|
expr = find(rules, name)
|
|
return fold(tracer(trace(rules)), expr)
|
|
})
|
|
|
|
const tracer = recurse => a => {
|
|
let log = (x, s) => Writer.tell(Str(s)).map(_ => x)
|
|
return a.cata({
|
|
Num: (x) => log(x, x+","),
|
|
Add: (x, y) => x.chain(xx => y.chain(yy => log(xx+yy,"+,"))),
|
|
Var: (name) => recurse(name).chain(x => log(x,name+","))
|
|
})
|
|
}
|
|
|
|
// On voit qu'on a calculé la valeur de b 2 fois! Ce n'est pas utile,
|
|
// puisque cette valeur ne changera pas au cours du calcul; et comme on
|
|
// répète le calcul autant de fois qu'il y a de références à une variable
|
|
// donnée, si l'arbre est un tant soit peu complexe les performances seront
|
|
// très mauvaises.
|
|
|
|
it('should trace the shape of the computation', function() {
|
|
let rule1 = Assign("a",add(ref("b"),ref("b"))),
|
|
rule2 = Assign("b",num(15)),
|
|
rules = [rule1,rule2],
|
|
result = trace(rules,"a").run(Str.zero)
|
|
expect(result.value).to.equal(30)
|
|
expect(result.output.s).to.equal("15,b,15,b,+,")
|
|
});
|
|
|
|
// Pour corriger ce problème on va avoir besoin de formuler une version
|
|
// "monadique" du catamorphisme, c'est-à-dire qu'on va pouvoir l'associer
|
|
// à un contexte (ou monade) dans lequel tout le calcul va se dérouler,
|
|
// et qui va pouvoir accumuler des informations au fur et à mesure, par
|
|
// exemple un cache des variables déjà calculées.
|
|
|
|
// On a déjà vu un exemple de monade, c'était Writer: voyons comment on
|
|
// reformule le catamorphisme pour qu'il se déroule dans la monade Writer.
|
|
// L'implémentation de cataM est inspirée de
|
|
// https://github.com/DrBoolean/excursion/
|
|
// D'abord on ajoute de la plomberie:
|
|
|
|
const cataM = (of, algM) => m =>
|
|
m.project()
|
|
.traverse(of, x => x.cataM(of, algM))
|
|
.chain(algM)
|
|
|
|
const traverse = function(of, f) {
|
|
return this.cata({
|
|
Num: (x) => of(this),
|
|
Add: (x, y) => f(x).chain(xx => f(y).chain(yy => of(Add(xx,yy)))),
|
|
Var: (name) => of(this)
|
|
})
|
|
}
|
|
Expr.prototype.traverse = traverse
|
|
Fx.prototype.cataM = function(of, alg) { return cataM(of, alg)(this) }
|
|
|
|
// Maintenant que c'est fait on voit qu'on a simplifié l'expression du
|
|
// catamorphisme: on n'a plus à expliciter l'enchaînement (sauf pour la
|
|
// récursion de plus haut niveau dans les variables)
|
|
|
|
let trace2 = R.curry((rules, name) => {
|
|
let find = (rules, name) => R.find(x => R.prop("name",x) == name,rules).expr,
|
|
expr = find(rules, name)
|
|
return cataM(Writer.of, tracer2(trace2(rules)))(expr)
|
|
})
|
|
|
|
const tracer2 = recurse => a => {
|
|
let log = (x, s) => Writer.tell(Str(s)).map(_ => x)
|
|
return a.cata({
|
|
Num: (x) => log(x,x+","),
|
|
Add: (x, y) => log(x+y,"+,"),
|
|
Var: (name) => recurse(name).chain(x => log(x,name+","))
|
|
})
|
|
}
|
|
|
|
it('should trace the shape of the computation, showing two passes through b', function() {
|
|
let rule1 = Assign("a",add(ref("b"),ref("c"))),
|
|
rule2 = Assign("b",num(15)),
|
|
rule3 = Assign("c",num(10)),
|
|
rules = [rule1,rule2,rule3],
|
|
result = trace2(rules,"a").run(Str.zero)
|
|
expect(result.value).to.equal(25)
|
|
expect(result.output.s).to.equal("15,b,10,c,+,")
|
|
});
|
|
|
|
// On a la possibilité "d'encapsuler" une monade dans une autre:
|
|
// on va se doter d'un State, une monade qui permet de stocker un
|
|
// état et de le modifier en le propageant dans tout le calcul, et
|
|
// conserver Writer à l'intérieur (on utilise la variante StateT,
|
|
// le T veut dire "transformation de monade")
|
|
|
|
// On peut aller plus loin et mémoiser le catamorphisme:
|
|
// https://idontgetoutmuch.wordpress.com/2011/05/15/monadic-caching-folds/
|
|
// ça ne semble pas nécessaire ici puisque tout se passe au niveau de
|
|
// la récursion sur "Var"
|
|
|
|
const S = StateT(Writer)
|
|
const log = (x, s) => S.lift(S.inner.tell(Str(s)).map(_ => x))
|
|
|
|
let trace3 = R.curry((rules, name) => {
|
|
let find = (rules, name) => R.find(x => R.prop("name",x) == name,rules).expr,
|
|
expr = find(rules, name)
|
|
return cataM(S.of, tracer3(trace3(rules)))(expr)
|
|
})
|
|
|
|
const memoize = f => name => {
|
|
let cache = result =>
|
|
result
|
|
.chain(x => result.modify(state => R.assoc(name,run(result),state))
|
|
.chain(z => S.of(x)))
|
|
|
|
return S.get.chain(state => {
|
|
let cached = state[name]
|
|
return cached ?
|
|
S.of(cached.value.value) : cache(f(name))
|
|
})
|
|
}
|
|
|
|
const tracer3 = recurse => a => {
|
|
return a.cata({
|
|
Num: (x) => log(x,x+","),
|
|
Add: (x, y) => log(x+y,"+,"),
|
|
Var: memoize ((name) => recurse(name).chain(x => log(x,name+",")))
|
|
})
|
|
}
|
|
|
|
const run = (c, state) => Writer.run(StateT.run(c, state),Str.zero)
|
|
|
|
it('should trace the shape of the computation, showing one pass through b', function() {
|
|
let rule1 = Assign("a",add(ref("b"),ref("b"))),
|
|
rule2 = Assign("b",num(15)),
|
|
rules = [rule1,rule2],
|
|
result = run(trace3(rules,"a"),{})
|
|
expect(result.value.value).to.equal(30)
|
|
expect(result.output.s).to.equal("15,b,+,")
|
|
});
|
|
|
|
});
|