Comme vous pourrez le constater si vous fouillez archéologiquement le wiki ou ce blog, le Enée est une I.A en cours de développement.
Fin juillet 2021, a été prise la décision d’opter pour python, se fiant sur les avancées des dernières CPU, car python bouffe pas mal de ressources.
Mais au vue des dernières bibliothèques accessibles, ce serait se voiler la face que d’ignorer ces points.
Et, du point de vue migration, une autre décision a été de prendre MongoDB comme mémoire.
Structure actuelle :
Dans la partie biblio, on veut y mettre du texte classique, epub, ou maximes, ou proverbes courts.
Le problème étant de savoir comment y mettre des romans ou essais, tel « Les Pensées » de Blaise Pascal.
Il faut tout d’abord savoir (cfr le wiki su Mongo) que la stucture des data est basé sur bson alias JSon.
Un roman aurait un problème avec les CRLF (cfr wiki 😉 )
Soluce by bibi :
from pymongo import MongoClient
client = MongoClient()
db = client.biblio
files = db.biblio
f = open('pensees.txt')
text = f.read()
doc = {
"titre" : "Pensées",
"Date" : "1670",
"auteur" : "Blaise Pascal",
"ref" : "",
"texte" : text,
"encrypt_media1" : ""
}
files.insert_one(doc)
Pour info, le « document » ou la « table » au sens SQL a la structure suivante :
{
"_id" : #génération automatique !!!!,
"titre" : "Titre_du_livre",
"Date" : "date_de_edition",
"auteur" : "Nom_de_auteur",
"ref" : "ref_internet_via_url_ou_autre",
"texte" : "Quare hoc quidem praeceptum, cuiuscumque est, ad tollendam amicitiam valet; illud potius praecipiendum fuit, ut eam diligentiam adhiberemus in amicitiis comparandis, ut ne quando amare inciperemus eum, quem aliquando odisse possemus. Quin etiam si minus felices in diligendo fuissemus, ferendum id Scipio potius quam inimicitiarum tempus cogitandum putabat."
}
Comment insérer ce foutu epub ????
Step 1
Télécharger votre bouquin sur ce site : https://be1lib.org/
Step 2
Transformer votre epub en fichier txt : https://www.zamzar.com/converters/ebook/epub-to-txt/
Step 3
from pymongo import MongoClient
client = MongoClient()
db = client.biblio
files = db.biblio
f = open('pensees.txt')
text = f.read()
doc = {
"titre" : "Pensées",
"Date" : "1670",
"auteur" : "Blaise Pascal",
"ref" : "",
"texte" : text,
"encrypt_media1" : ""
}
files.insert_one(doc)