Translate integers in a numpy array to a contiguous range 0…n

前端未结

关注

 2  575

I would like to translate arbitrary integers in a numpy array to a contiguous range 0...n, like this:

source: [2 3 4 5 4 3]
translating [2 3 4 5] -> [0 1


                      
              相关标签:


      
      
        
          2条回答        

        
                         				            
            
           
            
                              
                
              
              
                
                  借酒劲吻你        
                
              
                            
                2020-12-04 04:40
              
            
            
                                                                       
IIUC you can simply use np.unique's optional argument return_inverse, like so -

np.unique(source,return_inverse=True)[1]


Sample run -

In [44]: source
Out[44]: array([2, 3, 4, 5, 4, 3])

In [45]: np.unique(source,return_inverse=True)[1]
Out[45]: array([0, 1, 2, 3, 2, 1])

                                                                        
                                                        
            
            
              
                
                0
              
                 
                
               讨论(0)
              
              
                                                   
              
                                                            
            
                      
                    


               
            
    发布评论:
    
         
                        
    
    提交评论 
  
  

                    
                    
                    
                        
                        
                         加载中...
                        
                    
                
          
          	          
            
           
            
                              
                
              
              
                
                  谎友^        
                
              
                            
                2020-12-04 04:44
              
            
            
                                                                       
pandas.factorize is one method:

import pandas as pd

lst = [2, 3, 4, 5, 4, 3]
res = pd.factorize(lst, sort=True)[0]

# [0 1 2 3 2 1]


Note: this returns a list, while np.unique will always return an np.ndarray.
                                                                        
                                                        
            
            
              
                
                0
              
                 
                
               讨论(0)
              
              
                                                   
              
                                                            
            
                      
                    


               
            
    发布评论:
    
         
                        
    
    提交评论 
  
  

                    
                    
                    
                        
                        
                         加载中...
                        
                    
                
          
          	          
                             
        
        
          
            
            
              
              
            
    


                                 
              
            
                          
    

        
         
                验证码
                
                  
                
                
                   看不清?
                
              
                                  
                    
   
                 
             
              提交回复