Aller au menu - Aller au contenu

[Plan du site] Vous êtes ici --- > Le Site du Zéro > Les news > Logiciel > OutWit Hub : un navigateur Web sémantique et extensif > Lecture d'une news

Commentaires de news :
OutWit Hub : un navigateur Web sémantique et extensif

Revenir à liste des news

OutWit Hub : un navigateur Web sémantique et extensif

# Par s1404s, le 14/10/2008 à 03:37:42
OutWit Hub, une nouvelle extension pour Firefox, est considérée comme "le premier pas vers un navigateur Web sémantique et extensif" d'après ses développeurs. Mais qu'est-ce que cela signifie réellement ?


OutWit Hub et le défi du Web sémantique



Le Web sémantique en deux mots



Tim Berners Lee

D'après Tim Berners Lee, l'initiateur du World Wide Web et directeur de son consortium, le Web sémantique, appelé aussi le Web 3.0, désigne un Web où les informations en ligne seraient comprises par les ordinateurs pour que tout internaute puisse obtenir l'information qu'il recherche vraiment.

Contrairement au Web actuel, le Web sémantique sera "intelligent" dans le sens où le contenu sémantique des ressources en ligne sera interprétable aussi bien par les hommes que par les logiciels et les machines grâce à un système de métadonnées. Citation : Tim Berners Lee
Ce nouveau Web ira chercher l'information dans diverses bases de données et répondra aux voeux de tous ceux qui voudraient disposer d'un moteur de recherche solide.



OutWit Hub, qu'est-ce que c'est ?



Image utilisateur
OutWit Hub est un nouveau moteur de collecte automatique de données intégré dans une extension Firefox 3. Elle est destinée à faciliter et à améliorer la recherche sur le Web. Elle permet aux utilisateurs de récupérer des images, des documents, des listes ou tableaux de données à partir de n'importe quelles pages voire sites Web et ce, en quelques clics.

Lorsque vous parcourez des pages Web, OutWit les parcourt et extrait les données qui les composent sous forme de tableaux de données que vous pouvez exporter vers des dossiers, des fichiers Excel ou autre pour les utiliser ultérieurement. Voici ce que nous explique le créateur d'OutWib Technologies, J.C. Combaz :

Citation : J.C. Combaz
Si vous cherchez des photos de voiture de sport, les moteurs de recherche vous affichent des listes de vignettes avec des liens vers les pages qui contiennent ces images. OutWit place les photos en haute résolution dans un dossier de votre ordinateur. Si vous voulez des cotations boursières, les moteurs de recherche vous indiquent où vous pouvez trouver les chiffres; OutWit les extrait vers un fichier Excel sur votre bureau.


Comment cette extension Firefox fonctionne-t-elle ?




L'extension OutWit Hub est basée sur trois concepts :
  • Elle dissèque une page Web en différents éléments de données pour permettre aux internautes de les trier et de ne récupérer que les données qui les intéressent : images, liens, adresses e-mails, documents dont les documents PDF, etc.
  • Elle propose un panier à provisions, le Catch, dans lequel les utilisateurs peuvent glisser et déposer n'importe quelles données lorsqu'ils naviguent sur les pages Web.
  • Elle récolte des données sur le Web en un clic (enfin ça dépend ce que vous voulez :D ).

De quoi OutWit Hub est-elle capable ?



OutWit Hub est une extension assez puissante, même pour les développeurs les plus exigeants. Lorsque vous tapez des mots-clés, OutWit reconnaît très souvent ce que vous désirez. Voici quelques impressions d'écran :

Image utilisateur

Image utilisateur
OutWit Hub permet de récupérer des images en haute résolution à partir de vignettes affichées dans des galeries photo comme celle de gauche ou à partir des moteurs de recherche comme Google, Yahoo et compagnie.

De plus, OutWit reconnaît la structure d'une page Web, notamment les liens "suivant". Vous pouvez donc récupérer des tonnes de photos, d'images et de documents de manière automatique et en très peu de clics.

Elle vous permet aussi d'extraire des tableaux de données en HTML s'étalant sur plusieurs pages Web et reliées par le lien "suivant".
Image utilisateur

Vous pouvez récupérer des données qui ne sont pas codées avec la balise <table>. En effet, OutWit Hub essaie de retrouver un motif qui se répète sur toute une page Web. Un motif basique est : nom, prénom, numéro de téléphone, adresse, etc.

Des zéros très bons en programmation peuvent utiliser le noyau d'OutWit Hub afin de développer leurs propres extensions originales pour des usages spécifiques.

Conclusion



OutWit Hub n'est encore qu'un petit pas vers "le navigateur Web sémantique et extensif" puisqu'elle ne reconnaît pas encore toutes les données et qu'elle ne détecte pas systématiquement les liens "suivant". De plus, les fonctions tables et guess ne marchent pas à tous les coups.

Même s'il y a encore des choses à améliorer, elle peut d'ores et déjà constituer un outil intéressant pour les collectionneurs de photos, les développeurs, etc.



Pour bien débuter avec OutWit Hub sans trop vous embrouiller, voici des tutoriels :


Pour plus d'informations


34 Commentaires

Désolé, les commentaires de cette news sont désactivés, vous ne pouvez pas en ajouter !

Page : 1  2  Suivante
Pseudo Commentaire
1 visiteur sur cette news (0 membre et 1 anonyme)
Page : 1  2  Suivante
Hors ligne djo0012 # Posté le 14/10/2008 à 04:00:00
Groupe : Membres
sa semble etre une bonne extension mais par contre je me demande a quel point elle peut etre exploitable... enfin on verra a l'usage si sa apporte réellement a la navigation et a la recherche d'information.

desoler pour le francais j'ai un manque de moliere en moi depuis un bout :( Citation : moi-meme
Si vous n'arrivez pas a résoudre un problème c'est que vous n'avez pas assez travaillé dessus.
 
Hors ligne david96 # Posté le 14/10/2008 à 04:59:02
Avatar
Groupe : Membres
Excellente news !
Merci pour cette découverte, je trouve le concept très interessant.
Par contre, dommage que le plugin soit pour le moment incompatible avec linux 64 bits !
Y'a plus qu'à attendre...
 
Hors ligne MmAxX # Posté le 14/10/2008 à 05:08:10
Avatar
Groupe : Membres
Hum, sa risque pas de manger mon disque dur ce truc ? o_O

MmAxX
 
Hors ligne Alex # Posté le 14/10/2008 à 05:17:33
Big Brown Blue Bird
Avatar
Newsers
À la base, il ne fait qu'analyser la page sur demande. L'exportation est sur demande aussi ;)

Par contre je suis déçu, il semble y avoir quelques incompatibilité avec Linux (sur mon Firefox sur Kubuntu, j'ai pas réussi, j'ai dû venir sur Windows pour tester).

Citation : IRC
<Zopieux> Alexbad, tu parles beaucoup tout seul !
 
Hors ligne Dark_Trooper # Posté le 14/10/2008 à 06:48:09
Firefox c'est le bien
Avatar
Groupe : Membres
Pouvoir prendre les résultats d'une recherche Google plus rapidement, c'est franchement pas mal.

Dommage pour la non-compatibilité avec DeviantArt et SocialWallpapering, je viens de tester.

Mais à part ça, c'est vraiment rapide et pratique, j'ai un peu de mal avec l'outil qui permet de faire des tableaux à partir de listes, mais ça a vraiment l'air pratique... Je prends ^^

Ubuntu 8.04 est sorti, ruuuuuush :p
 
Hors ligne Nesquik69 # Posté le 14/10/2008 à 07:24:22
Slave of the Rythm
Avatar
Groupe : Membres
Bien que j'ai compris le principe de base, tout n'est pas encore très clair dans ma tête. Donc un test de l'extension s'impose pour mieux comprendre ^^ .

Dark-Trooper -> Au passage, pour ceux qui cherchent un moyen de visualiser toutes les images d'une galerie (pour certains sites compatibles seulement), je vous invite à lire ceci ;) .
 
Hors ligne Captain Awesome # Posté le 14/10/2008 à 07:35:58
Oh my fucking god !
Avatar
Groupe : Membres
Ça peut être pratique mais le faire manuellement est tout aussi rapide pour moi (glisser/déposer les photos sur le bureau).
 
Hors ligne Dark_Trooper # Posté le 14/10/2008 à 07:39:43
Firefox c'est le bien
Avatar
Groupe : Membres
Nesquik69, je connaissais pas, c'est vrai que c'est impressionant o_O

Merci pour le lien =)

Ubuntu 8.04 est sorti, ruuuuuush :p
 
Hors ligne geenux # Posté le 14/10/2008 à 08:30:12
Vive Qt
Avatar
Groupe : Membres
Ça m'a l'air d'être une très bonne extension, j'aurais aimé pouvoir la tester... Mais elle n'aime pas la version 64bits linux de firefox...
Hors ligne l'illusioniste # Posté le 14/10/2008 à 08:54:56
Avatar
Groupe : Membres
Très bonne news. Une extension à tester.

Première Loi: un robot ne peut pas porter atteinte à un être humain, ni permettre par son inaction que du mal soit fait à un être humain.
Deuxième Loi: un robot doit obéir aux ordres donnés par les êtres humains, sauf si de tels ordres entrent en contradictions avec la Première Loi.
Troisième Loi: un robot doit protéger son existence, tant que cette protection n'entre pas en contradiction avec la Première et/ou la Deuxième Loi.

Manuel de la robotique 58° édition (2085 ap. J.-C.)
 
Hors ligne MathX # Posté le 14/10/2008 à 10:17:00
Powered by Vinchz
Avatar
Newsers
Belle initiative, ça permettra d'économiser pas mal de temps à certains.
Hors ligne Prototype # Posté le 14/10/2008 à 11:15:21
Smoke it before it smoke you
Groupe : Membres
Ahhh enfin une news sur l'informatique, c'est pas pour dire mais depuis quelques temps toutes les news concernaient le site du zero, comme si l'actualité d'internet et informatique c'étais subitement arrêtée (pour qui ne lit que le sdz bien sure)

Bon bah sinon, extension à tester et bonne new :)

Google est au Net
ce que Microsoft est au OS


- Prototype -
 
Hors ligne MyGB # Posté le 14/10/2008 à 12:04:17
Une citation ?
Avatar
Groupe : Membres
Intéressant, mais sans avoir lu toute la news, c'est peut-être comme Cuil...
Je veux bien qu'il y ait du Web 3.0 mais parmi les millions d'abonnés à l'ADSL, les quelques milliers de fibrés, y'a toujours des 56K... De plus, les technologies supérieures ont tendance à ne pas être utilisés car trop de ressources consommés, 'fin, j'en ai l'impression...

Image utilisateur

</lien>
Image utilisateurImage utilisateurImage utilisateur


Y'a des trucs ci-dessous, voyez mon pseudo pour ma signature ;) .

Image utilisateur




Image utilisateur

Mon guide des solutions pour ce jeu :
Possiblité de changement de liens.
Mot de passe : CCDS
Taille : 387Ko.






Quelques unes de mes créations ci-dessous :
2D :
Fond d'écran disponible ici
Un petit dessin de planète ici
Un dessin de disque dur ici

 
Hors ligne gyom # Posté le 14/10/2008 à 12:10:30
Avatar
Groupe : Membres
Citation : MyGB
Intéressant, mais sans avoir lu toute la news, c'est peut-être comme Cuil...
Je veux bien qu'il y ait du Web 3.0 mais parmi les millions d'abonnés à l'ADSL, les quelques milliers de fibrés, y'a toujours des 56K... De plus, les technologies supérieures ont tendance à ne pas être utilisés car trop de ressources consommés, 'fin, j'en ai l'impression...


Effectivement, il aurait fallut lire la news en entier.

Il ne s'agit pas de proposer un nouveau moteur de recherche (du moins à ce que j'ai compris) mais simplement de respecter des normes et des standards pour que les navigateurs "comprennent" mieux les pages web.
Citation : Lee

Ce nouveau Web ira chercher l'information dans diverses bases de données et répondra aux voeux de tous ceux qui voudraient disposer d'un moteur de recherche solide.


Seulement pour ceux qui le voudraient ... les 56k ne sont pas obligés de suivre le moove :p


" Dans les magasins de lingerie, on ne voit pas de calendriers avec des photos de garage. "
 
Hors ligne guifson # Posté le 14/10/2008 à 12:24:24
si tu chreches ,tu trouves
Avatar
Groupe : Membres
Je trouve cela franchement très cool.
On essayera pour voir ce que ca donne.
A plus et merci pour le news
 
Hors ligne Lampadaire # Posté le 14/10/2008 à 12:39:04
Lampadaire ou suicidaire ?
Avatar
Groupe : Membres
Spécial ce truc oO.
J'ai l'impression que ça va être saoulant à comprendre comment ça marche, parce que ça ressemble bien à quelque chose de complexe ! o_O

Citation

SUDOKU
Proverbe japonais : « Si tu as le Nord devant toi, tu as forcément le Sud au cul »
 
Hors ligne KorangaR # Posté le 14/10/2008 à 14:40:51
Groupe : Membres
Citation : MyGB
Intéressant, mais sans avoir lu toute la news, c'est peut-être comme Cuil...
Je veux bien qu'il y ait du Web 3.0 mais parmi les millions d'abonnés à l'ADSL, les quelques milliers de fibrés, y'a toujours des 56K... De plus, les technologies supérieures ont tendance à ne pas être utilisés car trop de ressources consommés, 'fin, j'en ai l'impression...


Bah le web3.0 permet de rechercher plus facilement l'information souhaitée, donc ce n'est pas inaccessible aux 56k bien au contraire, après c'est sur que si ils veulent télécharger des vidéos, c'est pas le web 3 qui va améliorer la compression et la rapidité du dl.
Hors ligne counter ghost # Posté le 14/10/2008 à 15:06:11
Sauver ou Perir
Avatar
Groupe : Membres
humm çà à l'air pas trop mal je vais tester :) merci pour cette news!

.................................RTS-ONLINE.................................

...................................RTS-ONLINE...................................

Site sur les jeux de stratégie en temps réel
 
Hors ligne jordan # Posté le 14/10/2008 à 15:16:31
Développeur indépendant
Avatar
Groupe : Membres
Hum, je trouve que le titre est trompeur. Je pense également que cette extension ne respecte pas la définition de l'adjectif "sémantique".

Cette extension comme expliquée dans un des paragraphes de la news se contente de stocker des données qu'elle classe.

On est loin du concept sémantique où un même moteur/logiciel/site devrait pouvoir interroger plusieurs bases de données hétérocliques qui respecteraient toutes un schéma sémantique commun.

Cette extension construit juste une pseudo base de donnée pour son utilisateur. Et sans la partager visiblement.

On me dira que ce n'est qu'un premier pas, mais les développeurs de ce gadjet s'enflamment un peu trop à mon goût.
Hors ligne LinkKokiri # Posté le 14/10/2008 à 16:23:07
Du coté obscur
Avatar
Groupe : Membres
Je me trompe peut être mais il me semble que c'est un logiciel libre.

Secret (cliquez pour afficher)
"Eh, espèce de 'tit con, tu as enfreint les règles, un modo va te botter les fesses !"
 
Hors ligne zulon # Posté le 14/10/2008 à 16:54:29
The shrieker shrieks.
Avatar
Groupe : Membres
C'est quoi, un navigateur ou une extension à un navigateur existant, à savoir Firefox ?

Image utilisateur
 
Hors ligne robocop # Posté le 14/10/2008 à 17:02:29
Avatar
Groupe : Membres
Ca consiste en quoi le sémentique "web 3.0" ?
Si l'idée est de standardiser le nom des blocs menu, contenu, liens de navigations, etc..., moi, je pense que c'est pas mal du tout.
 
Hors ligne MathX # Posté le 14/10/2008 à 17:34:18
Powered by Vinchz
Avatar
Newsers
Je dirais plutôt qu'on lui donne le "titre" de navigateur car il inspecte chaque page. Mais sinon ça reste bien une extension pour firefox.
Hors ligne cgizmo # Posté le 14/10/2008 à 18:07:35
Avatar
Groupe : Membres
Ca a l'air interessant, mais je n'arrive pas a l'installer.
Citation : OutWit
"OutWit Kernel" could not be installed because it is not compatible with your Gran Paradiso build type (Linux_x86_64-gcc3)
Ce n'est visiblement pas compatible avec le 64bit sous linux...

Robotix, la passion de la robotique! - ex-ArchLinux user - retour vers Ubuntu pour plus de simplicitée
Citation : Murphy's law
  • If anything can go wrong, it will.
  • Logic is a systematic method of coming to the wrong conclusion with confidence.














Image utilisateur
 
Hors ligne dorian-do # Posté le 14/10/2008 à 18:15:46
cap de cliquer sur mon image ?
Avatar
Groupe : Membres
Cette extension m'a l'air très puissante.
Le coup du Web 3.0 alors que l'on arrive à peine sur le 2.0... c'est donc très fort !

Encore une bonne extension, persnnelement j'en utilise une très bien pour les développeurs de sites et les curieux ^^ qui est : firebug (très connue...)

Image utilisateur
 
Hors ligne ff_martial # Posté le 14/10/2008 à 18:26:40
Bonjour tous le monde !
Avatar
Groupe : Membres
o_O

Très impressionnant ! Merci beaucoup pour cette extension qui, je pense, va m'être bien utile !

Final fantasy, plus qu'un simple jeu vidéo, un véritable chef d'oeuvre...

Vous aimez Final fantasy, et vous voulez créer votre propre RPG ?!
N'hésitez pas, venez nous voir sur -->Final-RPG<--
 
Hors ligne kankan # Posté le 14/10/2008 à 19:42:50
kankan@internet:/com/sdz$
Avatar
Groupe : Membres
je trouve que le l'idée de sémantique n'est pas très pertinente pour parler ce ce logiciel. Certes, avec les captures d'écrans, l'on voit qu'il arrive à comprendre ce que l'on cherche, mais après, tout ce qu'il fait, c'est construire une base de données locale.
'fin bon, je vais tester et je reposte.

Edit : tiens, c'est bizarre, un CLUF à accepter... Et pas une licence libre "classique" : il s'agit d'un logiciel propriétaire où quoi ? (pas eu le temps de tout lire, je l'ai juste survolée, c'est tout).
 
Hors ligne lasl92260 # Posté le 14/10/2008 à 22:00:18
tout est relatif
Avatar
Groupe : Membres
Effectivement, non compatible linux 64bits... étrange pour une "simple extension"

De plus l'idée du web 3.0 ne se limite pas à "mon navigateur fait une opération de stockage répétitive à ma place" mais cela permettrai à des applications d'aller naviguer et de ramener des informations bruts pour les afficher en dehors du contexte web, de permettre de monter son propre "moteur de recherche local" agissant comme une extension de ceux préexistant, pouvoir basher des sites webs...
Comme le dit
Citation : les développeurs
le premier pas vers un navigateur Web sémantique et extensif
ce n'est donc pas un navigateur en lui même et ne justifie pas le titre; "OutWit Hub : un navigateur Web sémantique et extensif" l'idée est trés interressante, car à l'aide de regexp cela montre la puissance d'un weeb sémantique au utilisateurs, et va peut-etre donné un coup d'accélérateur à ce dévellopement.


Enfin:
Citation : J.C. Combaz
Si vous cherchez des photos [...] . OutWit place les photos en haute résolution dans un dossier de votre ordinateur. Si vous voulez des cotations boursières, [...]; OutWit les extrait vers un fichier Excel sur votre bureau.

Mais alors comment fait-on si on est sous linux puisqu'il faut avoir Office? </troll>

Et pour conclure le web 3.0 est génial, mais si nous pouvions déjà avoir un bon vrai web 2.0 ce serait déjà bien... (openId par ex.)
 
Hors ligne s1404s # Posté le 14/10/2008 à 23:37:16
Groupe : Membres
Citation : Jordan
Hum, je trouve que le titre est trompeur. Je pense également que cette extension ne respecte pas la définition de l'adjectif "sémantique".Cette extension comme expliquée dans un des paragraphes de la news se contente de stocker des données qu'elle classe.On est loin du concept sémantique où un même moteur/logiciel/site devrait pouvoir interroger plusieurs bases de données hétérocliques qui respecteraient toutes un schéma sémantique commun.


Je trouve que tu vas un peu fort en disant que les développeurs s'enflamment. C’est vrai, la version actuelle est plutôt basée sur une extraction “mécanique” mais le programme inclut déjà un début d’ontologie sémantique qui lui permet de reconnaître des éléments d’information (non seulement les images, liens emails etc. mais aussi les noms de personnes, marques, produits...) et de les classer dans beaucoup de cas sans intervention de l’utilisateur. En plus, si vous regardez bien il classera par exemple les numéros de téléphones ou les noms dans les mêmes colonnes, ce qui évitera beaucoup de boulot dans Excel.
Selon les développeurs le programme devrait devenir de plus en plus intelligent... A suivre....
Hors ligne lasl92260 # Posté le 14/10/2008 à 23:45:04
tout est relatif
Avatar
Groupe : Membres
À mon sens le problème vient du web qui n'a pas encore mué. Nous sommes en tout cas d'accord sur le fait que ce programme est très (trop?) mécanique. Toutefois le classement s'avère gêné par la nécessité du support d'un logiciel de navigation. Idéalement le flux devrait pouvoir être lu par n'importe quelle application sans nécessiter la moindre interprétation (idéalement). Ce que je critiques aussi est essentiellement le titre trompeur donné à la news...

D'autre part en ce qui concerne la citation comprenant excel, cela peut-être considéré comme de la publicité/spam car excel est une marque déposé, alors que le mot tableur aurait été plus approprié car pour les utilisateur d'OpenOffice (et non pas d'Office) l'export en fichier Excel n'est pas très intéressant... (enfin bon je suis peut être un peu pointilleux mais bon)
 

Désolé, les commentaires de cette news sont désactivés, vous ne pouvez pas en ajouter !

Revenir à liste des news

Changer de design | En savoir plus | Plan du site | Politique d'accessibilité | Règles | RSS tutoriels | RSS news
Édité par Simple IT SARL : Nous contacter | Notre blog | Revue de presse | Publicité

Y'a plus rien à lire, faut remonter maintenant !

Hébergement web - Correction de tutoriels - Créer un site
Vous souhaitez apparaître ici ? Contactez-nous.

Nombre de connectés 123 Zéros connectés | Requêtes SQL 6 requêtes | Temps de génération de la page : Total (SQL) 0.1451s (0.1299s)