Vous n'êtes pas identifié(e).

#1 24/06/2011 09:31:54

apm
Membre

Machine Learning et PostgreSQL

Bonjour,

Je participe actuellement au développement d'un outil qui permet de classer et prédire à partir de PostgreSQL, sans connaissance en datamining ou en statistiques.

Si certains d'entre vous sont intéressés, je suis très à l'écoute d'avis sur cette idée.

L'idée est que, à partir d'une table contenant des valeurs NULL, telle que celle-ci ("species" est NULL pour id=150):

demo=> select * from iris;
 id  | sepallength | sepalwidth | petallength | petalwidth | species 
-----+-------------+------------+-------------+------------+---------
 150 |         5.9 |        3.0 |         5.1 |        1.8 | 
  62 |         5.9 |        3.0 |         4.2 |        1.5 | Iris-versicolor
 132 |         7.9 |        3.8 |         6.4 |        2.0 | Iris-virginica
[...]

PredictiveDB permette de prédire les valeurs NULL:

demo=> select * from pdb.prediris where id = 150;
 id  |    species     |     error_risk     
-----+----------------+--------------------
 150 | Iris-virginica | 5.2631578947368425
(1 ligne)

Un grand merci pour tout conseil!

Alain-Pierre

Dernière modification par apm (30/06/2011 11:37:40)

Hors ligne

#2 30/06/2011 11:26:48

apm
Membre

Re : Machine Learning et PostgreSQL

aïe!, il semblerait que je ne me sois  pas adressé au bon endroit en ce qui concerne l'intérêt pour le datamining!

Tant pis! Néanmoins, si, d'aventure, un forumeur connaissait des utilisateurs de base de données potentiellement
intéressés par le datamining ou l'analyse prédictive, je reste très intéressé par des avis ou des conseils.

Hors ligne

#3 30/06/2011 11:39:00

gleu
Administrateur

Re : Machine Learning et PostgreSQL

Pour être franc, à mon avis, c'est trop vague pour que ça engendre un intérêt quelconque. Pour moi, je ne vois pas quel commentaire faire (d'où mon absence de réponse sur le thread).


Guillaume.

Hors ligne

#4 30/06/2011 12:17:54

apm
Membre

Re : Machine Learning et PostgreSQL

Merci, un retour négatif reste un retour!

Pour tenter d'être plus précis en deux mots, l'idée est que, pour monter une chaine d'analyse prédictive (càd prévoir de nouvelles valeurs à partir de données passées), il faut exporter ses données hors de la base de données (ETL type Talend) , utiliser un outil de machine learning (réseaux de neurones, arbre de décision, SVMs, R, SAS), et puis les réinjecter dans postgresql (encore ETL).

Je me demandais si des utilisateurs de bases de données avaient été confrontés à ce type de problématique.

J'espère que ces explications auront aidé à clarifier les choses.


PS. Un autre exemple de prédiction à partir de PostgreSQL figure là:
http://blog.predictivedb.com/post/14872 … res-en-sql

Hors ligne

#5 03/07/2011 23:31:10

cedric
Membre

Re : Machine Learning et PostgreSQL

Que dire de plus que «cela me semble être une très bonne idée».
J'imagine que les entrepeneurs du web vont adorer...

Autrement, avez-vous tenté d'appliquer des modèles météos ou complexes ?


Cédric Villemain +33 (0)6 20 30 22 52
http://2ndQuadrant.fr/
PostgreSQL: Support 24x7 - Développement, Expertise et Formation

Hors ligne

#6 06/07/2011 14:17:18

adestaville
Membre

Re : Machine Learning et PostgreSQL

Bonjour,

StatSoft est éditeur de logiciels de Data Mining.

Votre projet est réalisable avec l'outil STATISTICA Data Miner (extraction des données, modélisation et choix du modèle puis déploiement du modèle SQL, C#, java, SAS, PMML, SVB, C/C++ etc...). Vous avez la possibilité d'automatiser la chaîne avec notre produit STATISTICA Entreprise (automatisation des requêtes, des analyses, des rapports, déploiement des modèles etc...)
Il s'agit de la gamme logicielle proposant le plus grand nombre d'algorithmes du marché et ayant gagné le PAKDD 2010 (dernière compétition internationale de Data Mining).

N'hésitez pas à nous contacter à info@statsoft.fr ou 01 45 185 999

Pour plus de renseignements : www.statsoft.fr
Nous vous aiderons à mûrir votre projet et faire un test si vous êtes intéressé.

Je vous laisse regarder tout cela.

Arnaud

Hors ligne

#7 06/07/2011 14:49:59

apm
Membre

Re : Machine Learning et PostgreSQL

cedric a écrit :

Que dire de plus que «cela me semble être une très bonne idée».
J'imagine que les entrepeneurs du web vont adorer...

Autrement, avez-vous tenté d'appliquer des modèles météos ou complexes ?

Merci pour ces encouragements!

Pour l'instant, outre les types classiques (booléens, entiers, varchar,...), nous gérons également des types plus complexes: texte en langue naturelle (type TEXT de psql), type url. Nous avons un temps songé à une intégration avec PostGIS pour traiter des données géographiques sans avoir eu l'occasion de concrétiser. Par contre, nous n'avons pas eu l'occasion de traiter des données météos. Pensez-vous à une idée d'application particulière?

Hors ligne

#8 06/07/2011 14:53:54

apm
Membre

Re : Machine Learning et PostgreSQL

adestaville a écrit :

Votre projet est réalisable avec l'outil STATISTICA Data Miner (extraction des données, modélisation et choix du modèle puis déploiement du modèle SQL, C#, java, SAS, PMML, SVB, C/C++ etc...).

Merci beaucoup. Qu'entendez-vous par "déploiement du modèle SQL"?

Hors ligne

#9 06/07/2011 17:00:38

adestaville
Membre

Re : Machine Learning et PostgreSQL

Oui en effet je me suis mal exprimé et il y a en effet un point important (ou pas) à élucider ici.

Il est possible de générer du code C# sous une forme qui peut être directement intégrée dans des fonctions personnalisées SQL Server, que vous pouvez ensuite utiliser dans une procédure stockée pour utiliser le modèle directement à l’intérieur de la base de données.

Le code Java peut être utilisé de la même manière dans des fonctions personnalisées Oracle.

Le principal avantage de cette méthode de déploiement réside dans les gains de performances ; le déploiement interne sur la base de données peut être exécuté environ dix fois plus vite que le traitement externe. Après ce n'est pas obligatoire... Tout dépend où l'on veut mettre le niveau de service. Et ici je ne crois pas que ce soit très utile.

Et en effet pour PostgreSQL, n'étant pas un grand spécialiste de la question ... Et bien je ne crois pas qu'il y ait de possibilités encore à ma connaissance... Il faut que je me renseigne si ça vous intéresse bien sûr.

Il est bien sûr possible d'importer et de réécrire dans PostGreSQL puisque compatible ODBC. On ré-attaquera la base pour y appliquer le modèle prédictif et ainsi de suite... Donc nickel.

Je rajouterais que pour transformer du texte en données structurées, il y a le module STATISTICA Text Miner.

Pour les données météos, je me rappelle avoir vu cela l'année dernière (vaguement) pour un projet d'économie d'énergie de bâtiments. Les prévisions météos étaient très utiles (températures externes, temps, taux d'humidité etc...) et nous prévoyions à l'avance d'augmenter le chauffage ou non... Je ne sais bien sûr pas si ça a un rapport avec votre problématique. Encore faut-il les avoir ces données météos !

Pour les données géographiques, cela se traite aussi.

Arnaud

Hors ligne

#10 06/07/2011 18:09:27

cedric
Membre

Re : Machine Learning et PostgreSQL

apm a écrit :
cedric a écrit :

Que dire de plus que «cela me semble être une très bonne idée».
J'imagine que les entrepeneurs du web vont adorer...

Autrement, avez-vous tenté d'appliquer des modèles météos ou complexes ?

Merci pour ces encouragements!

Pour l'instant, outre les types classiques (booléens, entiers, varchar,...), nous gérons également des types plus complexes: texte en langue naturelle (type TEXT de psql), type url. Nous avons un temps songé à une intégration avec PostGIS pour traiter des données géographiques sans avoir eu l'occasion de concrétiser. Par contre, nous n'avons pas eu l'occasion de traiter des données météos. Pensez-vous à une idée d'application particulière?

Rien de précis, je me demandais quelle 'complexité' avait été testée :-)


Cédric Villemain +33 (0)6 20 30 22 52
http://2ndQuadrant.fr/
PostgreSQL: Support 24x7 - Développement, Expertise et Formation

Hors ligne

#11 08/07/2011 14:46:52

apm
Membre

Re : Machine Learning et PostgreSQL

@adestaville: Merci pour cette réponse détaillée.

adestaville a écrit :

Pour les données géographiques, cela se traite aussi.

Vous avez également un module dédié?

Hors ligne

#12 08/07/2011 14:50:47

apm
Membre

Re : Machine Learning et PostgreSQL

cedric a écrit :

Rien de précis, je me demandais quelle 'complexité' avait été testée :-)

Très bien! En tout cas, si vous avez des idées de problèmes liés à l'analyse prédictive, n'hésitez pas en nous en faire part!

Hors ligne

Pied de page des forums