Vous n'êtes pas identifié(e).
Pages :: 1
Bonjour à tous,
Tout d'abord un grand merci aux initiateurs de ce site par lequel je me suis initiée au php/sql il y a quelques années.
Je ne suis pas devenue super brillante en php faute d'avoir pratiqué assez régulièrement et j'ai encore de très nombreuses lacunes dans le domaine
Aujourd'hui je suis confrontée à un problème que je n'arrive pas à solutionner à 2 niveaux:
J'ai créé un site où l'administrateur peut télécharger des fichiers pdf dans un sous-dossier. Je souhaite installer un moteur de recherche en php qui permette au visiteur de retrouver par une recherche par mots clé les documents qui l'intéresse. J'ai provisoirement installé un champ de recherche google mais cette solution ne me convient pas car le module de recherche renvoie vers google et que je ne suis pas certaine que google indexera assez régulièrement les documents, s'il les indexe...
J'ai trouvé un petit moteur de recherche (a Blork Engine) que je trouve très sympa car simple mais bien entendu il n'indexe pas le pdf. D'un autre côté, j'ai vu plusieurs moteurs qui proposaient d'utiliser pdftotext pour extraire les contenus des pdf et les indexer.
Donc voici ma première question : comment dois-je procéder pour utiliser l'exe pdftotext depuis un script php?
La deuxième est bien entendu liée à la première : comment et où dois-je installer mon exe? J'ai lu sur certains forum que c'était dans le cg-bin mais d'autres semble le mettre ailleurs...
Question subsidiaire: j'ai lu aussi que les hébergements OVH 90PLAN ne permettaient pas d'installer ce type de script... savez-vous si c'est vrai? J'ai posé la question au support mais apparemment il n'ont pas compris ma question car il m'ont demandé quel logiciel je voulais installer alors que j'avais mis en titre "pdftotext sur 90PLAN?"... j'ai reformulé la question et j'attends leur seconde réponse
Merci d'avance pour votre aide!
Isabelle
Hors ligne
Hello,
Je te recommande de jeter un oeil à PhpDig : http://www.phpdig.net/francaise.php?action=doc#toc3
Lui aussi exige des applis installées sur le système pour indexer le PDF cependant, il est déjà prévu pour s'en servir
En ce qui concerne l'installation de ton exe, sous Linux c'est pas franchement important, il suffit de faire un lien symbolique dans un des répertoires d'inclusion de PHP (cf php.ini) et tu appelleras ton exe avec exec()
Pourtant tu n'es pas sorti de ton problème pour autant, car le 90 PLAN d'oVH est un hébergement mutualisé et je doute qu'il te fasse la fleur d'installer un exe juste pour toi sur le système. Si tu veux faire de l'indexation de PDF il te faut un hébergement dédié je pense...
La programmation est composée de 80% de réflexion pour 20% de syntaxe -> réfléchissez à votre problème par étapes
Recommande l'utilisation du pattern Singleton
Si jamais je poste un morceau de code pour vous aider, prenez bien compte que je n'ai pas forcément testé le code que je poste et qu'il est possible qu'il contienne des erreurs
Hors ligne
Alors effectivement sur les hébergements mutualisés OVH ce n'est pas possible (confirmé par le support).
Concernant les serveurs dédié voici la réponse du support:
"Sur serveur dédié on part du principe que tout peux y être installé, donc je dirais que oui."
La question reste: est-ce que je prends un serveur dédié ovh rien que pour ça? ....
Hors ligne
Saluton,
J'ai créé un site où l'administrateur peut télécharger des fichiers pdf dans un sous-dossier. Je souhaite installer un moteur de recherche en php qui permette au visiteur de retrouver par une recherche par mots clé les documents qui l'intéresse. J'ai provisoirement installé un champ de recherche google mais cette solution ne me convient pas car le module de recherche renvoie vers google et que je ne suis pas certaine que google indexera assez régulièrement les documents, s'il les indexe...
et
est-ce que je prends un serveur dédié ovh rien que pour ça? ....
J'aurais tendance à t'inviter à réfléchir au problème sous d'autres angles. [Pensu aliamaniere]
Ne serait-il pas plus judicieux, si c'est techniquement possible, de récupérer l'info à la source sous une autre forme que pdf, quitte à utiliser FPDF, par exemple, pour régénérer le fichier pdf, si le besoin se présentait, à partir de son contenu sauvegardé dans un fichier XML ou une base de données ?
Avantages : volumétrie de stockage réduite, indexation facilitée.
Gloire à qui n'ayant pas d'idéal sacro-saint,
Se borne à ne pas trop emmerder ses voisins. G. Brassens Don Juan 1976.
Avĉjo MoKo kantas
La chaîne YouTube MoKo Papy
Hors ligne
La difficulté est que les documents stockés dans le dossier sont des comptes rendus de réunion. Il seront téléchargés par différents utilisateurs depuis différents postes via un formulaire en ligne. Quelque soit la solution que je choisis, il faudra qu'elle soit facile à mettre en oeuvre par n'importe quel utilisateur. Il y a sans doute une solution dans le sens que tu proposes mais je en saurais dire à l'avance ce que pourrait donné un copier collé depuis un document de type .doc (le plus couramment utilisé...) vers un champ text d'une base mysql puis restitué en pdf pour l'affichage... sachant que je passerai probablement par FCKeditor pour le champ texte.
Dès que j'ai fini de programmer ma galerie photo (qui me pose d'autres soucis haha), je ferai des essais dans ce sens...
Hors ligne
Pages :: 1