Ross B. Girshick


Original: http://www.cs.berkeley.edu/~rbg/

Chercheur
Recherche de Microsoft, Redmond
Stagiaire postdoctoral
Université de Californie à Berkeley, EECS
r@EECS.Berkeley.edu
CV / google scholar / thèse de doctorat
papiers : journal / Conférence
Site Web de MSR

 

À propos de moi
J’ai terminé mes études de doctorat en vision par ordinateur à l’Université de Chicago sous la direction de Pedro Felzenszwalb en avril 2012. Ensuite, j’ai passé deux ans incroyablement merveilleux comme un post-doctorant à l’UC Berkeley sous Jitendra Malik. Maintenant, je suis chercheur à Microsoft Research à Redmond, WA.

Mes principaux intérêts de recherche sont en vision par ordinateur, AI et apprentissage automatique. Je suis particulièrement axée sur la construction des modèles de détection d’objets et de reconnaissance. Ces modèles visent à intégrer les biais « droite » pour que les algorithmes d’apprentissage machine peuvent comprendre le contenu de l’image de modéré à des ensembles de données à grande échelle. J’ai toujours un oeil vers des régimes rapides qui fonctionnent bien dans la pratique.

Au cours de mon doctorat, j’ai passé le temps comme un stagiaire de recherche à Microsoft Research Cambridge, UK, travaillant sur l’estimation de la posture humaine d’images de profondeur (Kinect). Aussi, j’ai participé de plusieurs entrées de la première place dans le défi de détection objet PASCAL VOC et reçoit le prix « lifetime achievement » pour mon travail sur les modèles de pièce déformable. Je pense qu’il s’agit de la durée de vie du défi PASCAL — et pas le mien !

Actualités

LSDA : notre nouvelle 2014 NIPS papier sur l’apprentissage des détecteurs pour les classes d’objets 7,5 K avec faible supervision.
R-CNN arXiv v5 : nouveaux résultats de détection en utilisant le réseau de 16 couche Oxford Jacob (COV 2007 test carte = 66,0 %).
Code DeepPyramid sur GitHub. Remplacez vos pyramides de fonctionnalité de porc.
Docteurs en médecine podiatrique sont CNNs : nouvelles Tech Report sur la connexion entre les docteurs en médecine podiatrique et CNNs

  • R-CNN sur ImageNet détection (ILSVRC2013) obtient carte de 31,4 % (record a été OverFeat à la carte de 24,3 %). Voir les Sections 2.5 et 4 dans la b mise à jour pour plus de détails.
  • R-CNN : rapport technique sur les réseaux neuronaux convolutifs pour détection d’objet en PASCAL VOC http://arxiv.org/abs/1311.2524

 

Pages du projet

 

Articles dans des revues
Compréhension de la scène d’intérieur avec des Images RVB-D: Segmentation de bas en haut, de détection d’objet et de Segmentation sémantique
Saurabh Gupta, Pablo Arbeláez, Ross Girshick, Jitendra Malik
International Journal of Computer Vision (IJCV), 2014
code / bibtex

 


L’homme efficace Pose Estimation de profondeur unique Images
J. Shotton, R. Girshick, A. Fitzgibbon, T. Sharp, M. Cook, M. Finocchio, r. Moore, P. Kohli, Criminisi A., A. Kipman, Blake A.
IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 35, no 12, décembre 2013
BibTeX

Une description intégrée de la Kinect original posent algorithme d’estimation et de notre algorithme ICCV 2011.
Détection d’objet avec une formation partie basé Models†
P. Felzenszwalb, R. Girshick, d. McAllester, d. Rigaud
IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 32, no 9, septembre 2010
Code : code de PAMI / latest code (voc-release5) / bibtex

Partie déformable models (DPM).

Aussi, CACM recherche Best of :

Objet visuel détection avec modèles partie déformable
P. Felzenszwalb, R. Girshick, d. McAllester, d. Rigaud
Communications of the ACM, no 9 (2013): 97-105

 

Comptes rendus de conférences
LSDA : Détection de grande échelle grâce à l’Adaptation
Judy Hoffman, Sergio Guadarrama, Eric Tzeng, Ronghang Hu, Jeff Donahue, Ross Girshick, Trevor Darrell, Kate Saenko
Neurale Information Processing Systems (NIPS), 2014
projet de code, modèles / bibtex

Un algorithme d’adaptation domaine pour convertir image classificateurs en détecteurs de l’objet. Compte tenu des données d’entraînement de détection pour un petit nombre de classes (200), nous apprenons des détecteurs de l’objet pour grand nombre de classes (7,5 K), pour qui il existe des annotations seulement au niveau image. Code et modèles sont disponibles.
Segmentation et détection simultanée
Bharath Hariharan, Pablo Arbeláez, Ross Girshick, Jitendra Malik
European Conference on Computer Vision (ECCV), 2014
page du projet (avec code) / bibtex

Détecter simultanément et segmenter les objets, une approche intégrée basée sur la R-CNN. Atteint des performances de state-of-the-art sur la détection de PASCAL VOC traditionnelles et tâches de segmentation sémantique comme c’était comme notre métrique de SDS nouvellement proposée.

Saurabh Gupta, Ross Girshick, Pablo Arbeláez Jitendra Malik
European Conference on Computer Vision (ECCV), 2014
Comment pouvez-vous connaître les fonctionnalités de détection en images de profondeur ? Nous présentons une méthode qui surclasse nettement naïvement en passant une carte de profondeur à un réseau de neurones convolutif. Notre système a également crée 2,5 D propositions de la région et sorties des segmentations de l’instance.

Pulkit Agrawal, Ross Girshick, Jitendra Malik
European Conference on Computer Vision (ECCV), 2014
Cette version du livre contient un patch mineur contre la version paru dans ECCV 14 ; la métrique de dataset de SUN a été changée pour la précision standard de classe moyenne.

Ning Zhang, Jeff Donahue, Ross Girshick, Trevor Darrell
European Conference on Computer Vision (ECCV), 2014
présentation orale

Hyun Oh Song, Ross Girshick, Stefanie Jegelka, Julien Mairal, Zaid Harchaoui, Trevor Darrell
International Conference on Machine Learning (CBTI), 2014

R. Girshick, J. Donahue, T. Darrell, J. Malik
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014
présentation orale
rapport tech arXiv (y compris les résultats ImageNet) / Supplément / code / affiche / slides / bibtex
Cet article propose R-CNN, un système de détection d’objet visual state-of-the-art que propositions ascendantes région combine avec des fonctionnalités puissantes calculée par un réseau de neurones convolutif. Au moment de sa sortie, R-CNN a amélioré la meilleure performance de détection précédent sur PASCAL COV 2012 de 30 % par rapport, passant de 40,9 % à 53,3 % de précision moyenne moyenne.

G. Gkioxari *, B. hemery *, R. Girshick, J. Malik
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014
* égale contribution

A. Vedaldi, S. Mahendran, S. Tsogkas, S. Marechal, R. Girshick, J. Kannala, E. Rahtu, I. Kokkinos, M. B. Blaschko, Weiss d., B. Thai, K. Simonyan, N. Saphra, Mohamed S.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014

R. Girshick, J. Malik
IEEE International Conference on Computer Vision (ICCV), 2013
Vous êtes-vous déjà demandé ce qui rend le DPM tique ? Nous disséquer DPM formation de comprendre quels bits sont importants. Aussi, nous présentons LDA latente, une méthode rapide pour former des docteurs en médecine podiatrique sans utiliser des exemples négatifs durs.

R. Girshick *, H. O. chanson *, T. Darrell
International Conference on Machine Learning (CBTI), 2013
présentation orale
Accélérer une vaste gamme de prédicteurs structurés (y compris les docteurs en médecine podiatrique et SVMs multiclass) en apprenant une activations sur un dictionnaire des atomes de modèle. Accélération de même que le papier de sparselets ECCV 2012, mais avec beaucoup plus de précision.

Chanson de H.O., Zickler S., T. Althoff, R. Girshick, M. Fritz, C. Geyer, P. Felzenszwalb, T. Darrell
European Conference on Computer Vision (ECCV), 2012
Détection rapide DPM par clairsemée codage des paramètres du modèle.

R. Girshick, P. Felzenszwalb, d. McAllester
Neurale Information Processing Systems (NIPS), 2011
Détection de personne State-of-the-art sur PASCAL VOC à l’aide de DPM modèles décrits dans un cadre de grammaire.
R. Girshick, J. Shotton, P. Kohli, Criminisi A. A. Fitzgibbon
IEEE International Conference on Computer Vision (ICCV), 2011
Poser l’estimation à l’aide du capteur de profondeur de Kinect. Plus rapide (4 x) et plus précis que l’original Kinect posent algorithme d’estimation (Shotton et al., CVPR 2011).

P. Felzenszwalb, R. Girshick, McAllester d.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2010
présentation orale
Cascade de rapide algorithme pour la détection de DPM (environ 14 fois plus rapide que la ligne de base).

C. Klivans, R. Girshick, R. Basri, d. Jacobs, P. Felzenszwalb
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2009

Simulant chinois brosse peinture : la paramétrique poilue brosse
R. Girshick
Affiches de l’ACM SIGGRAPH, 2004
Session : Nonphotorealistic Animation et rendu
Premier cycle thèse , Brandeis University, mai 2004.
†Authors par ordre alphabétique
Thèse de doctorat

R. Girshick
Thèse de doctorat, The University of Chicago, avril 2012
Modèles et algorithmes qui permettent d’améliorer de plus de 50 % sur le DPM original carte.
 
R. Girshick
Thèse de M.S., The University of Chicago, décembre 2009
Cascade de la DPM  (CVPR 2010) a été développé dans mon mémoire de maîtrise.

Comments are closed.