mon-entreprise/test/tree.test.js

440 lines
14 KiB
JavaScript

import R from 'ramda'
import { expect } from 'chai'
import daggy from 'daggy'
import { Maybe as M } from 'ramda-fantasy'
import { StateT, Writer } from 'akh'
describe('simplified tree walks', function() {
// Notre domaine peut se simplifier à une liste d'équations à trous:
// a: 45
// b: a + c
// d: a + 4
// e: b + d
// Disons que je veux connaitre "e", alors il va me manquer "c"
// Si je connais "c", alors je peux calculer "e"
// Et mon ambition est aussi de pouvoir visualiser le calcul en HTML
// Donc j'ai une structure plate que je transforme en arbre (ce n'est pas
// le focus de la présente exploration), je veux pouvoir demander des choses
// diverses à cet arbre: l'évaluer, repérer les trous, le transformer en HTML
// Plus tard je vais avoir des trucs plus sophistiqués, par exemple:
// b: a + (bleu: b, vert: c)
// qui est équivalent à:
// b: b-bleu + b-vert
// b-bleu: a + b
// b-vert: a + c
// Le but du jeu est de pouvoir le représenter de façon compacte, mais
// d'avoir un arbre simple à manipuler
// Pour intégrer dans le simulateur, il faut remplir les exigences
// suivantes:
// X décorer l'arbre avec une valeur à chaque noeud
// X réaliser le calcul de façon efficiente (1 fois par variable)
// - savoir "court-circuiter" le calcul de variables manquantes dans les conditionnelles
// - avoir un moyen de gérer les composantes et filtrage
// Ce qu'on décrit est un framework de programmation déclarative: on stipule des
// définitions (salaire net = brut - cotisations) mais on les donne sans ordre
// impératif, on laisse au moteur le soin de calculer les dépendances
// Chaque élément de notre base de règles est une définition:
const Def = daggy.taggedSum('Def', {
Assign: ['name', 'expr']
})
const { Assign } = Def
// Par contre, à l'exécution, il faut bien calculer des "effets de bord"
// pour rester performant: chaque évaluation d'une définition doit mettre
// à jour le 'dictionnaire' des valeurs connues, puis le mettre à disposition
// de la suite du calcul - on verra comment au Chapitre 3
// La partie droite d'une définition est une expression:
const Expr = daggy.taggedSum('Expr', {
Num: ['x'],
Add: ['x', 'y'],
Var: ['name']
// NotIf: ['condition','formule'],
// OnlyIf: ['condition','formule'],
// AnyOf: ['conditions'],
// AllOf: ['conditions'],
})
const { Num, Add, Var } = Expr
// Chapitre 1...
// Le type Expr est la traduction en JS du type suivant en Haskell,
// "naivement récursif":
// data Expr = Num Int | Var String | Add Expr Expr
// Il se trouve qu'on peut gagner beaucoup en introduisant une petite
// complexité: on va exprimer la récursion avec un niveau d'indirection,
// la première étape étant de rendre le type polymorphique sur ce qui
// est récursif:
// data ExprF r = Num Int | Var String | Add r r
// Par exemple, une addition de deux additions c'est de type ExprF (ExprF r),
// et si je veux décrire des imbrications plus poussées d'additions dans
// des additions il me faudra un ExprF (ExprF (ExprF r)) et ainsi de
// suite: on a "déroulé" la récursion dans le type d'origine.
// On peut alors retrouver le type d'origine en introduisant un
// "constructeur de point fixe de type", appelé Fx, et en introduisant
// ce qu'on appelle un "functor type" (c'est le suffixe F)
// data Expr = Fx ExprF
// Le point fixe de f est une solution à l'équation x = f x - on
// peut l'appliquer à des fonctions récursives, voir par exemple:
// https://www.vex.net/~trebla/haskell/fix.xhtml
// En JS ça ne marche pas parce que JS est strict et non lazy...
// Quand au point fixe d'un type, c'est le point fixe de son
// constructeur: une solution à l'équation T = Fx T
// En JS c'est juste une fonction qui emballe et une qui déballe:
const Fx = daggy.tagged('Fx', ['x'])
Fx.prototype.project = function() {
return this.x
}
const unFix = fx => fx.project()
// Les helpers suivants rendent moins pénible la construction de valeurs
// notamment pour les tests
let num = x => Fx(Num(x))
let add = (x, y) => Fx(Add(x, y))
let ref = name => Fx(Var(name))
// Une application de la théorie des catégories permet de dériver
// la fonction "fold" suivante, qui généralise aux structures récursives
// la notion de "reduction" (comme pour les listes), on l'appelle aussi
// un catamorphisme
// fold :: Functor f => (f a -> a) -> Fix f -> a
const fold = R.curry((algebra, x) =>
R.compose(algebra, R.map(fold(algebra)), unFix)(x)
)
// Cf. https://www.schoolofhaskell.com/user/bartosz/understanding-algebras
// Dans ce contexte, un "algebre" est une fonction qui nous dit comment calculer
// la réduction pour un noeud à partir des valeurs calculées pour les noeuds fils
// Cette fonction fournit la traversée
Expr.prototype.map = function(f) {
return this.cata({
Num: x => this, // fixed
Add: (x, y) => Add(f(x), f(y)),
Var: name => this
})
}
// Celle-ci l'évaluation
const evaluator = state => a => {
return a.cata({
Num: x => M.Just(x),
Add: (x, y) => R.lift(R.add)(x, y),
Var: name => M.toMaybe(state[name]) // Doesn't typecheck
})
}
let evaluate = (expr, state = {}) =>
fold(evaluator(state), expr).getOrElse(null) // for convenience
// Voici donc l'évaluation d'un arbre...
it('should provide a protocol for evaluation', function() {
let tree = num(45),
result = evaluate(tree)
expect(result).to.equal(45)
})
it('should evaluate expressions', function() {
let tree = add(num(45), num(25)),
result = evaluate(tree)
expect(result).to.equal(70)
})
it('should evaluate nested expressions', function() {
let tree = add(num(45), add(num(15), num(10))),
result = evaluate(tree)
expect(result).to.equal(70)
})
// Problème: on évalue l'arbre tout entier d'un seul coup; mais
// peut-on aussi "décorer" l'arbre pendant sa traversée avec les
// valeurs intermédiaires ? On verra que oui, au Chapitre 2; en
// attendant on voudrait aussi savoir quelles sont les variables
// manquantes...
const collector = state => a => {
return a.cata({
Num: x => [],
Add: (x, y) => R.concat(x, y),
Var: name => (state[name] ? [] : [name])
})
}
let missing = (expr, state = {}) => fold(collector(state), expr)
it('should evaluate expressions involving variables', function() {
let tree = add(num(45), ref('a')),
result = evaluate(tree, { a: 25 })
expect(result).to.equal(70)
})
it('should evaluate expressions involving missing variables', function() {
let tree = add(num(45), ref('b')),
result = evaluate(tree, { a: 25 })
expect(result).to.equal(null)
})
it('should provide a protocol for missing variables', function() {
let tree = ref('a'),
result = missing(tree)
expect(result).to.deep.equal(['a'])
})
it('should locate missing variables in expressions', function() {
let tree = add(num(45), ref('a')),
result = missing(tree)
expect(result).to.deep.equal(['a'])
})
it('should locate missing variables in nested expressions', function() {
let tree = add(add(num(35), ref('a')), num(25)),
result = missing(tree)
expect(result).to.deep.equal(['a'])
})
it('should locate missing variables in nested expressions', function() {
let tree = add(add(num(35), ref('a')), num(25)),
result = missing(tree, { a: 25 })
expect(result).to.deep.equal([])
})
// Chapitre 2...
// Pour annoter l'arbre avec les valeurs intermédiaires on utilise un
// type "Cofree Comonad": ce sont des paires (fst,snd) dont la première
// valeur est un noeud de l'arbre et la seconde l'annotation; on a un
// constructeur ann et une fonction de lecture
// Cf https://github.com/willtim/recursion-schemes/
// or http://www.timphilipwilliams.com/slides/HaskellAtBarclays.pdf
const AnnF = daggy.tagged('AnnF', ['fr', 'a'])
let ann = ({ fst, snd }) => Fx(AnnF(fst, snd))
let nodeValue = annf => {
let { fr, a } = unFix(annf)
return a
}
// fork est l'opérateur "&&&" de Haskell: (f &&& g) x = Pair(f(x),g(x))
let fork = (f, g) => x => ({ fst: f(x), snd: g(x) })
// synthesize combine l'application d'un algèbre fourni f et de l'annotation
let synthesize = f => {
let algebra = f =>
R.compose(ann, fork(R.identity, R.compose(f, R.map(nodeValue))))
return fold(algebra(f))
}
let annotate = (state, tree) => synthesize(evaluator(state))(tree)
it('should annotate tree with evaluation results', function() {
let tree = add(num(45), add(num(15), num(10))),
result = nodeValue(annotate({}, tree)).getOrElse(null)
expect(result).to.equal(70)
})
// Chapitre 3
// On sait evaluer des expressions, il faut aussi être capable de
// gérer les règles définissant les variables appelées dans ces
// expressions; voyons ce que ça donne avec un algèbre plus simple:
let calculate = R.curry((rules, name) => {
let find = (rules, name) =>
R.find(x => R.prop('name', x) == name, rules).expr,
expr = find(rules, name)
return fold(evaluator2(calculate(rules)), expr)
})
const evaluator2 = calculate => a => {
return a.cata({
Num: x => x,
Add: (x, y) => x + y,
Var: name => calculate(name)
})
}
it('should resolve variable dependencies', function() {
let rule1 = Assign('a', add(ref('b'), ref('b'))),
rule2 = Assign('b', num(15)),
rules = [rule1, rule2],
result = calculate(rules, 'a')
expect(result).to.equal(30)
})
// Utilisons un Writer (un idiome fonctionnel pour par exemple écrire des logs)
// pour examiner le calcul de plus près.
const Str = daggy.tagged('Str', ['s'])
Str.zero = Str('')
Str.prototype.zero = Str.zero
Str.prototype.concat = function(b) {
return Str(this.s + b.s)
}
let trace = R.curry((rules, name) => {
let find = (rules, name) =>
R.find(x => R.prop('name', x) == name, rules).expr,
expr = find(rules, name)
return fold(tracer(trace(rules)), expr)
})
const tracer = recurse => a => {
let log = (x, s) => Writer.tell(Str(s)).map(_ => x)
return a.cata({
Num: x => log(x, x + ','),
Add: (x, y) => x.chain(xx => y.chain(yy => log(xx + yy, '+,'))),
Var: name => recurse(name).chain(x => log(x, name + ','))
})
}
// On voit qu'on a calculé la valeur de b 2 fois! Ce n'est pas utile,
// puisque cette valeur ne changera pas au cours du calcul; et comme on
// répète le calcul autant de fois qu'il y a de références à une variable
// donnée, si l'arbre est un tant soit peu complexe les performances seront
// très mauvaises.
it('should trace the shape of the computation', function() {
let rule1 = Assign('a', add(ref('b'), ref('b'))),
rule2 = Assign('b', num(15)),
rules = [rule1, rule2],
result = trace(rules, 'a').run(Str.zero)
expect(result.value).to.equal(30)
expect(result.output.s).to.equal('15,b,15,b,+,')
})
// Pour corriger ce problème on va avoir besoin de formuler une version
// "monadique" du catamorphisme, c'est-à-dire qu'on va pouvoir l'associer
// à un contexte (ou monade) dans lequel tout le calcul va se dérouler,
// et qui va pouvoir accumuler des informations au fur et à mesure, par
// exemple un cache des variables déjà calculées.
// On a déjà vu un exemple de monade, c'était Writer: voyons comment on
// reformule le catamorphisme pour qu'il se déroule dans la monade Writer.
// L'implémentation de cataM est inspirée de
// https://github.com/DrBoolean/excursion/
// D'abord on ajoute de la plomberie:
const cataM = (of, algM) => m =>
m
.project()
.traverse(of, x => x.cataM(of, algM))
.chain(algM)
const traverse = function(of, f) {
return this.cata({
Num: x => of(this),
Add: (x, y) => f(x).chain(xx => f(y).chain(yy => of(Add(xx, yy)))),
Var: name => of(this)
})
}
Expr.prototype.traverse = traverse
Fx.prototype.cataM = function(of, alg) {
return cataM(of, alg)(this)
}
// Maintenant que c'est fait on voit qu'on a simplifié l'expression du
// catamorphisme: on n'a plus à expliciter l'enchaînement (sauf pour la
// récursion de plus haut niveau dans les variables)
let trace2 = R.curry((rules, name) => {
let find = (rules, name) =>
R.find(x => R.prop('name', x) == name, rules).expr,
expr = find(rules, name)
return cataM(Writer.of, tracer2(trace2(rules)))(expr)
})
const tracer2 = recurse => a => {
let log = (x, s) => Writer.tell(Str(s)).map(_ => x)
return a.cata({
Num: x => log(x, x + ','),
Add: (x, y) => log(x + y, '+,'),
Var: name => recurse(name).chain(x => log(x, name + ','))
})
}
it('should trace the shape of the computation, showing two passes through b', function() {
let rule1 = Assign('a', add(ref('b'), ref('c'))),
rule2 = Assign('b', num(15)),
rule3 = Assign('c', num(10)),
rules = [rule1, rule2, rule3],
result = trace2(rules, 'a').run(Str.zero)
expect(result.value).to.equal(25)
expect(result.output.s).to.equal('15,b,10,c,+,')
})
// On a la possibilité "d'encapsuler" une monade dans une autre:
// on va se doter d'un State, une monade qui permet de stocker un
// état et de le modifier en le propageant dans tout le calcul, et
// conserver Writer à l'intérieur (on utilise la variante StateT,
// le T veut dire "transformation de monade")
// On peut aller plus loin et mémoiser le catamorphisme:
// https://idontgetoutmuch.wordpress.com/2011/05/15/monadic-caching-folds/
// ça ne semble pas nécessaire ici puisque tout se passe au niveau de
// la récursion sur "Var"
const S = StateT(Writer)
const log = (x, s) => S.lift(S.inner.tell(Str(s)).map(_ => x))
let trace3 = R.curry((rules, name) => {
let find = (rules, name) =>
R.find(x => R.prop('name', x) == name, rules).expr,
expr = find(rules, name)
return cataM(S.of, tracer3(trace3(rules)))(expr)
})
const memoize = f => name => {
let cache = result =>
result.chain(x =>
result
.modify(state => R.assoc(name, run(result), state))
.chain(z => S.of(x))
)
return S.get.chain(state => {
let cached = state[name]
return cached ? S.of(cached.value.value) : cache(f(name))
})
}
const tracer3 = recurse => a => {
return a.cata({
Num: x => log(x, x + ','),
Add: (x, y) => log(x + y, '+,'),
Var: memoize(name => recurse(name).chain(x => log(x, name + ',')))
})
}
const run = (c, state) => Writer.run(StateT.run(c, state), Str.zero)
it('should trace the shape of the computation, showing one pass through b', function() {
let rule1 = Assign('a', add(ref('b'), ref('b'))),
rule2 = Assign('b', num(15)),
rules = [rule1, rule2],
result = run(trace3(rules, 'a'), {})
expect(result.value.value).to.equal(30)
expect(result.output.s).to.equal('15,b,+,')
})
})