fix (#86)

xadupre · web-flow · commit be474b32cb3d · 2025-11-08T09:57:14.000+01:00
diff --git a/_doc/practice/exams/td_note_2025.ipynb b/_doc/practice/exams/td_note_2025.ipynb
@@ -20,7 +20,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 1,
+   "execution_count": 32,
    "metadata": {},
    "outputs": [
     {
@@ -29,7 +29,7 @@
        "np.int64(45)"
       ]
      },
-     "execution_count": 1,
+     "execution_count": 32,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -47,6 +47,60 @@
     "distance(table1, table2)"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Le minimum serait..."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 33,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "np.int64(1)"
+      ]
+     },
+     "execution_count": 33,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "distance(np.array([[18, 18], [7, 8], [8, 6]]), table2)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Et sinon une petite erreur en oubliant la permutation sur les colonnes."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 35,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "np.int64(7)"
+      ]
+     },
+     "execution_count": 35,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "distance(np.array([[18, 18], [8, 7], [6, 8]]), table2)"
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -193,23 +247,23 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q7 - C'est b eaucoup trop long.\n",
+    "## Q7 - C'est beaucoup trop long.\n",
     "\n",
     "On prop ose que calculer chaque p ermutation séparément. On cherche donc la meilleure p ermutation qui minimise la distribution de la somme par ligne et par colonne entre les deux matrices. Ecrire une fonctionne qui implémente ce raisonnement.\n"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 6,
+   "execution_count": 37,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
-       "((0, 1), (1, 0, 2))"
+       "((1, 0, 2), (0, 1))"
       ]
      },
-     "execution_count": 6,
+     "execution_count": 37,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -228,8 +282,8 @@
     "\n",
     "def optimise_fast(table1, table2):\n",
     "    return (\n",
-    "        optimise_vecteur(table1.sum(axis=0), table2.sum(axis=0)),\n",
     "        optimise_vecteur(table1.sum(axis=1), table2.sum(axis=1)),\n",
+    "        optimise_vecteur(table1.sum(axis=0), table2.sum(axis=0)),\n",
     "    )\n",
     "\n",
     "\n",
@@ -240,7 +294,28 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Le coût est en $O(i!) + O(j!)$. Pas nécessairement optimal mais beaucoup plus rapide."
+    "Le coût est en $O(i!) + O(j!)$. Pas nécessairement optimal mais beaucoup plus rapide. On obtient la distance :"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 38,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "np.int64(7)"
+      ]
+     },
+     "execution_count": 38,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "p1, p2 = optimise_fast(table1, table2)\n",
+    "distance(table1[p1, :][:, p2], table2)"
    ]
   },
   {
@@ -262,7 +337,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": 39,
    "metadata": {},
    "outputs": [
     {
@@ -304,7 +379,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
+   "execution_count": 40,
    "metadata": {},
    "outputs": [
     {
@@ -332,49 +407,57 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
+   "execution_count": 42,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
-       "((0, 1), (2, 0, 1))"
+       "((1, 0, 2), (0, 1), np.int64(7))"
       ]
      },
-     "execution_count": 17,
+     "execution_count": 42,
      "metadata": {},
      "output_type": "execute_result"
     }
    ],
    "source": [
     "def optimise_vecteur_tri(vec1, vec2):\n",
-    "    pos_vec1 = [(v, i) for i, v in enumerate(vec1)]\n",
-    "    pos_vec1.sort()\n",
-    "    return tuple(p[1] for p in pos_vec1)\n",
+    "    # on tri dans l'ordre croissant\n",
+    "    pos_vec1 = sorted([(v, i) for i, v in enumerate(vec1)])\n",
+    "    pos_vec2 = sorted([(v, i) for i, v in enumerate(vec2)])\n",
+    "    # on a deux permutations, il suffit de les composer.\n",
+    "    p1 = list(p[1] for p in pos_vec1)\n",
+    "    p2 = list(p[1] for p in pos_vec2)\n",
+    "    p = [p1[p2[i]] for i in range(len(p1))]\n",
+    "    return tuple(p)\n",
     "\n",
     "\n",
     "def optimise_fast_tri(table1, table2):\n",
     "    return (\n",
-    "        optimise_vecteur_tri(table1.sum(axis=0), table2.sum(axis=0)),\n",
     "        optimise_vecteur_tri(table1.sum(axis=1), table2.sum(axis=1)),\n",
+    "        optimise_vecteur_tri(table1.sum(axis=0), table2.sum(axis=0)),\n",
     "    )\n",
     "\n",
     "\n",
-    "optimise_fast_tri(table1, table2)"
+    "table1 = np.array([[8, 7], [18, 18], [6, 8]])\n",
+    "table2 = np.array([[18, 18], [7, 9], [8, 6]])\n",
+    "p1, p2 = optimise_fast_tri(table1, table2)\n",
+    "p1, p2, distance(table1[p1, :][:, p2], table2)"
    ]
   },
   {
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "On revient au problème d'optimisation : $\\lVert AM - B \\rVert^2$. Il faudrait pouvoir forcer les coefficients de la matrice à être 0 ou 1 en ajoutant une contrainte. On utilise pour cela fonction $f(x)=x(1-X)$ qui vaut 0 quand $x \\epsilon \\{0,1\\}$. On cherche donc $M$ qui minimise $\\lVert AM - B \\rVert^2 + \\lambda \\lVert M^2*(1-M)^2\\rVert$ où $*$ est une multiplication terme à terme. Mais résoudre ce problème n'est pas simple. On en restera là pour le moment."
+    "On revient au problème d'optimisation : $\\lVert AM - B \\rVert^2$. Il faudrait pouvoir forcer les coefficients de la matrice à être 0 ou 1 en ajoutant une contrainte. On utilise pour cela fonction $f(x)=x(1-X)$ qui vaut 0 quand $x \\epsilon \\{0,1\\}$. On cherche donc $M$ qui minimise $\\lVert AM - B \\rVert^2 + \\lambda \\lVert M^2*(1-M)^2\\rVert$ où ``*`` est une multiplication terme à terme. Mais résoudre ce problème n'est pas simple. On en restera là pour le moment."
    ]
   },
   {
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q9 - Comment utiliser cette fonction p our implémenter une version plus rapide de la fonction à la question 5."
+    "## Q9 - Comment utiliser cette fonction pour implémenter une version plus rapide de la fonction à la question 5."
    ]
   },
   {
@@ -388,14 +471,62 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q10 - La troisième année, une colonne est coupée en deux : une catégorie est divisée en deux sous-catégorie. Que proposez-vous p our y remédier ?"
+    "## Q10 - La troisième année, une colonne est coupée en deux : une catégorie est divisée en deux sous-catégorie. Que proposez-vous pour y remédier ?"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "L'idée est assez simple, on choisit au hasard deux lignes de la seconde matrice et on les aggrège. On utilise la fonction précédente pour en déduire les deux permutations les moins coûteuses puis on conserve le coût de cette permutation. On fait de même pour toutes les paires et on ne garde que la meilleure paire.\n",
+    "\n",
+    "Ce n'était pas demandé dans l'énoncé mais on pourait implémenter ce schéma comme suit :"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 45,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "(np.int64(7), (1, 0, 2), (0, 1), (2, 3))"
+      ]
+     },
+     "execution_count": 45,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "def optimise_fast_tri_paire(table1, table2):\n",
+    "    best = None\n",
+    "    for i in range(table2.shape[0] - 1):\n",
+    "        for j in range(i + 1, table2.shape[0]):\n",
+    "            table2p = np.zeros(table1.shape, dtype=table2.dtype)\n",
+    "            table2p[:, :] = table2[:-1, :]\n",
+    "            table2p[i, :] += table2[j, :]\n",
+    "            p1, p2 = optimise_fast_tri(table1, table2p)\n",
+    "            t = table1[p1, :][:, p2]\n",
+    "            d = distance(t, table2p)\n",
+    "            if best is None or d < best[0]:\n",
+    "                best = d, p1, p2, (i, j)\n",
+    "    return best\n",
+    "\n",
+    "\n",
+    "table1 = np.array([[8, 7], [18, 18], [6, 8]])\n",
+    "# on divise par deux les deux valeurs de la dernière ligne\n",
+    "# et on les réplique\n",
+    "table2 = np.array([[18, 18], [7, 9], [4, 3], [4, 3]])\n",
+    "optimise_fast_tri_paire(table1, table2)"
    ]
   },
   {
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "L'idée est assez simple, on choisit au hasard deux lignes de la seconde matrice et on les aggrège. On la fonction précédente pour en déduire les deux permutations les moins coûteuses puis on conserve le coût de cette permutation. On fait pour toutes les paires et on ne garde que la meilleure paire."
+    "Tout est cohérent."
    ]
   },
   {